PyPI - datacontract-cli - Versions diffs - 0.9.7__py3-none-any.whl → 0.9.9__py3-none-any.whl - Mend

datacontract-cli 0.9.7py3-none-any.whl → 0.9.9py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of datacontract-cli might be problematic. Click here for more details.

Files changed (62) hide show

datacontract/breaking/breaking.py +48 -57
datacontract/cli.py +100 -80
datacontract/data_contract.py +178 -128
datacontract/engines/datacontract/check_that_datacontract_contains_valid_servers_configuration.py +5 -1
datacontract/engines/datacontract/check_that_datacontract_file_exists.py +9 -8
datacontract/engines/datacontract/check_that_datacontract_str_is_valid.py +26 -22
datacontract/engines/fastjsonschema/check_jsonschema.py +31 -25
datacontract/engines/fastjsonschema/s3/s3_read_files.py +8 -6
datacontract/engines/soda/check_soda_execute.py +58 -36
datacontract/engines/soda/connections/bigquery.py +5 -3
datacontract/engines/soda/connections/dask.py +0 -1
datacontract/engines/soda/connections/databricks.py +2 -2
datacontract/engines/soda/connections/duckdb.py +25 -8
datacontract/engines/soda/connections/kafka.py +36 -17
datacontract/engines/soda/connections/postgres.py +3 -3
datacontract/engines/soda/connections/snowflake.py +4 -4
datacontract/export/avro_converter.py +9 -11
datacontract/export/avro_idl_converter.py +65 -42
datacontract/export/csv_type_converter.py +36 -0
datacontract/export/dbt_converter.py +43 -32
datacontract/export/great_expectations_converter.py +141 -0
datacontract/export/html_export.py +46 -0
datacontract/export/jsonschema_converter.py +3 -1
datacontract/export/odcs_converter.py +5 -7
datacontract/export/protobuf_converter.py +12 -10
datacontract/export/pydantic_converter.py +131 -0
datacontract/export/rdf_converter.py +34 -11
datacontract/export/sodacl_converter.py +118 -21
datacontract/export/sql_converter.py +30 -8
datacontract/export/sql_type_converter.py +44 -4
datacontract/export/terraform_converter.py +4 -3
datacontract/imports/avro_importer.py +65 -18
datacontract/imports/sql_importer.py +0 -2
datacontract/init/download_datacontract_file.py +2 -2
datacontract/integration/publish_datamesh_manager.py +6 -12
datacontract/integration/publish_opentelemetry.py +30 -16
datacontract/lint/files.py +2 -2
datacontract/lint/lint.py +26 -31
datacontract/lint/linters/description_linter.py +12 -21
datacontract/lint/linters/example_model_linter.py +28 -29
datacontract/lint/linters/field_pattern_linter.py +8 -8
datacontract/lint/linters/field_reference_linter.py +11 -10
datacontract/lint/linters/notice_period_linter.py +18 -22
datacontract/lint/linters/quality_schema_linter.py +16 -20
datacontract/lint/linters/valid_constraints_linter.py +42 -37
datacontract/lint/resolve.py +50 -14
datacontract/lint/schema.py +2 -3
datacontract/lint/urls.py +4 -5
datacontract/model/breaking_change.py +2 -1
datacontract/model/data_contract_specification.py +8 -7
datacontract/model/exceptions.py +13 -2
datacontract/model/run.py +3 -2
datacontract/web.py +3 -7
datacontract_cli-0.9.9.dist-info/METADATA +951 -0
datacontract_cli-0.9.9.dist-info/RECORD +64 -0
datacontract/lint/linters/primary_field_linter.py +0 -30
datacontract_cli-0.9.7.dist-info/METADATA +0 -603
datacontract_cli-0.9.7.dist-info/RECORD +0 -61
{datacontract_cli-0.9.7.dist-info → datacontract_cli-0.9.9.dist-info}/LICENSE +0 -0
{datacontract_cli-0.9.7.dist-info → datacontract_cli-0.9.9.dist-info}/WHEEL +0 -0
{datacontract_cli-0.9.7.dist-info → datacontract_cli-0.9.9.dist-info}/entry_points.txt +0 -0
{datacontract_cli-0.9.7.dist-info → datacontract_cli-0.9.9.dist-info}/top_level.txt +0 -0

datacontract/export/avro_idl_converter.py CHANGED Viewed

@@ -1,12 +1,14 @@
-from datacontract.model.data_contract_specification import DataContractSpecification, Field
-from datacontract.lint.resolve import inline_definitions_into_data_contract
+import typing
 from dataclasses import dataclass
 from enum import Enum
-import typing
 from io import StringIO
+from datacontract.lint.resolve import inline_definitions_into_data_contract
+from datacontract.model.data_contract_specification import \
+    DataContractSpecification, Field
 from datacontract.model.exceptions import DataContractException
 def to_avro_idl(contract: DataContractSpecification) -> str:
     """Serialize the provided data contract specification into an Avro IDL string.
@@ -18,6 +20,7 @@ def to_avro_idl(contract: DataContractSpecification) -> str:
     to_avro_idl_stream(contract, stream)
     return stream.getvalue()
 def to_avro_idl_stream(contract: DataContractSpecification, stream: typing.TextIO):
     """Serialize the provided data contract specification into Avro IDL."""
     ir = _contract_to_avro_idl_ir(contract)
@@ -28,6 +31,7 @@ def to_avro_idl_stream(contract: DataContractSpecification, stream: typing.TextI
         _write_model_type(model_type, stream)
     stream.write("}\n")
 class AvroPrimitiveType(Enum):
     int = "int"
     long = "long"
@@ -38,49 +42,71 @@ class AvroPrimitiveType(Enum):
     null = "null"
     bytes = "bytes"
 class AvroLogicalType(Enum):
     decimal = "decimal"
     date = "date"
     time_ms = "time_ms"
     timestamp_ms = "timestamp_ms"
 @dataclass
 class AvroField:
     name: str
     required: bool
     description: typing.Optional[str]
 @dataclass
 class AvroPrimitiveField(AvroField):
     type: typing.Union[AvroPrimitiveType, AvroLogicalType]
 @dataclass
 class AvroComplexField(AvroField):
     subfields: list[AvroField]
 @dataclass
 class AvroArrayField(AvroField):
     type: AvroField
 @dataclass
 class AvroModelType:
     name: str
     description: typing.Optional[str]
     fields: list[AvroField]
 @dataclass
 class AvroIDLProtocol:
     name: typing.Optional[str]
     description: typing.Optional[str]
     model_types: list[AvroModelType]
-avro_primitive_types = set(["string", "text", "varchar",
-                            "float", "double", "int",
-                            "integer", "long", "bigint",
-                            "boolean", "timestamp_ntz",
-                            "timestamp", "timestamp_tz",
-                            "date", "bytes",
-                            "null"])
+avro_primitive_types = set(
+    [
+        "string",
+        "text",
+        "varchar",
+        "float",
+        "double",
+        "int",
+        "integer",
+        "long",
+        "bigint",
+        "boolean",
+        "timestamp_ntz",
+        "timestamp",
+        "timestamp_tz",
+        "date",
+        "bytes",
+        "null",
+    ]
+)
 def _to_avro_primitive_logical_type(field_name: str, field: Field) -> AvroPrimitiveField:
     result = AvroPrimitiveField(field_name, field.required, field.description, AvroPrimitiveType.string)
@@ -114,10 +140,11 @@ def _to_avro_primitive_logical_type(field_name: str, field: Field) -> AvroPrimit
                 model=field,
                 reason="Unknown field type {field.type}",
                 result="failed",
-                message="Avro IDL type conversion failed."
+                message="Avro IDL type conversion failed.",
             )
     return result
 def _to_avro_idl_type(field_name: str, field: Field) -> AvroField:
     if field.type in avro_primitive_types:
         return _to_avro_primitive_logical_type(field_name, field)
@@ -125,17 +152,14 @@ def _to_avro_idl_type(field_name: str, field: Field) -> AvroField:
         match field.type:
             case "array":
                 return AvroArrayField(
-                    field_name,
-                    field.required,
-                    field.description,
-                    _to_avro_idl_type(field_name, field.items)
+                    field_name, field.required, field.description, _to_avro_idl_type(field_name, field.items)
                 )
             case "object" | "record" | "struct":
                 return AvroComplexField(
                     field_name,
                     field.required,
                     field.description,
-                    [_to_avro_idl_type(field_name, field) for (field_name, field) in field.fields.items()]
+                    [_to_avro_idl_type(field_name, field) for (field_name, field) in field.fields.items()],
                 )
             case _:
                 raise DataContractException(
@@ -144,56 +168,55 @@ def _to_avro_idl_type(field_name: str, field: Field) -> AvroField:
                     model=type,
                     reason="Unknown Data Contract field type",
                     result="failed",
-                    message="Avro IDL type conversion failed."
+                    message="Avro IDL type conversion failed.",
                 )
 def _generate_field_types(contract: DataContractSpecification) -> list[AvroField]:
     result = []
-    for (_, model) in contract.models.items():
-        for (field_name, field) in model.fields.items():
+    for _, model in contract.models.items():
+        for field_name, field in model.fields.items():
             result.append(_to_avro_idl_type(field_name, field))
     return result
 def generate_model_types(contract: DataContractSpecification) -> list[AvroModelType]:
     result = []
-    for (model_name, model) in contract.models.items():
-        result.append(AvroModelType(
-            name=model_name,
-            description=model.description,
-            fields=_generate_field_types(contract)
-        ))
+    for model_name, model in contract.models.items():
+        result.append(
+            AvroModelType(name=model_name, description=model.description, fields=_generate_field_types(contract))
+        )
     return result
 def _model_name_to_identifier(model_name: str):
-    return "".join([word.title() for word in  model_name.split()])
+    return "".join([word.title() for word in model_name.split()])
-def _contract_to_avro_idl_ir(contract: DataContractSpecification) -> AvroIDLProtocol:
+def _contract_to_avro_idl_ir(contract: DataContractSpecification) -> AvroIDLProtocol:
     """Convert models into an intermediate representation for later serialization into Avro IDL.
-      Each model is converted to a record containing a field for each model field.
-      """
+    Each model is converted to a record containing a field for each model field.
+    """
     inlined_contract = contract.model_copy()
     inline_definitions_into_data_contract(inlined_contract)
-    protocol_name = (_model_name_to_identifier(contract.info.title)
-                     if contract.info and contract.info.title
-                     else None)
-    description = (contract.info.description if
-                   contract.info and contract.info.description
-                   else None)
-    return AvroIDLProtocol(name=protocol_name,
-                           description=description,
-                           model_types=generate_model_types(inlined_contract))
+    protocol_name = _model_name_to_identifier(contract.info.title) if contract.info and contract.info.title else None
+    description = contract.info.description if contract.info and contract.info.description else None
+    return AvroIDLProtocol(
+        name=protocol_name, description=description, model_types=generate_model_types(inlined_contract)
+    )
 def _write_indent(indent: int, stream: typing.TextIO):
     stream.write("    " * indent)
 def _write_field_description(field: AvroField, indent: int, stream: typing.TextIO):
     if field.description:
         _write_indent(indent, stream)
         stream.write(f"/** {field.description} */\n")
 def _write_field_type_definition(field: AvroField, indent: int, stream: typing.TextIO) -> str:
     # Write any extra information (such as record type definition) and return
     # the name of the generated type. Writes descriptions only for record
@@ -215,7 +238,7 @@ def _write_field_type_definition(field: AvroField, indent: int, stream: typing.T
             for subfield in subfields:
                 subfield_types.append(_write_field_type_definition(subfield, indent + 1, stream))
             # Reference all defined record types.
-            for (field, subfield_type) in zip(field.subfields, subfield_types):
+            for field, subfield_type in zip(field.subfields, subfield_types):
                 _write_field_description(field, indent + 1, stream)
                 _write_indent(indent + 1, stream)
                 stream.write(f"{subfield_type} {field.name};\n")
@@ -234,15 +257,15 @@ def _write_field_type_definition(field: AvroField, indent: int, stream: typing.T
         case _:
             raise RuntimeError("Unknown Avro field type {field}")
-def _write_field(field: AvroField,
-                indent,
-                stream: typing.TextIO):
+def _write_field(field: AvroField, indent, stream: typing.TextIO):
     # Start of recursion.
     typename = _write_field_type_definition(field, indent, stream)
     _write_field_description(field, indent, stream)
     _write_indent(indent, stream)
     stream.write(f"{typename} {field.name};\n")
 def _write_model_type(model: AvroModelType, stream: typing.TextIO):
     # Called once for each model
     if model.description:

datacontract/export/csv_type_converter.py ADDED Viewed

@@ -0,0 +1,36 @@
+# https://duckdb.org/docs/data/csv/overview.html
+# ['SQLNULL', 'BOOLEAN', 'BIGINT', 'DOUBLE', 'TIME', 'DATE', 'TIMESTAMP', 'VARCHAR']
+def convert_to_duckdb_csv_type(field) -> None | str:
+    type = field.type
+    if type is None:
+        return "VARCHAR"
+    if type.lower() in ["string", "varchar", "text"]:
+        return "VARCHAR"
+    if type.lower() in ["timestamp", "timestamp_tz"]:
+        return "TIMESTAMP"
+    if type.lower() in ["timestamp_ntz"]:
+        return "TIMESTAMP"
+    if type.lower() in ["date"]:
+        return "DATE"
+    if type.lower() in ["time"]:
+        return "TIME"
+    if type.lower() in ["number", "decimal", "numeric"]:
+        # precision and scale not supported by data contract
+        return "VARCHAR"
+    if type.lower() in ["float", "double"]:
+        return "DOUBLE"
+    if type.lower() in ["integer", "int", "long", "bigint"]:
+        return "BIGINT"
+    if type.lower() in ["boolean"]:
+        return "BOOLEAN"
+    if type.lower() in ["object", "record", "struct"]:
+        # not supported in CSV
+        return "VARCHAR"
+    if type.lower() in ["bytes"]:
+        # not supported in CSV
+        return "VARCHAR"
+    if type.lower() in ["array"]:
+        return "VARCHAR"
+    if type.lower() in ["null"]:
+        return "SQLNULL"
+    return "VARCHAR"

datacontract/export/dbt_converter.py CHANGED Viewed

@@ -7,9 +7,6 @@ from datacontract.model.data_contract_specification import \
     DataContractSpecification, Model, Field
 def to_dbt_models_yaml(data_contract_spec: DataContractSpecification):
     dbt = {
         "version": 2,
@@ -23,7 +20,7 @@ def to_dbt_models_yaml(data_contract_spec: DataContractSpecification):
 def to_dbt_staging_sql(data_contract_spec: DataContractSpecification, model_name: str, model_value: Model) -> str:
     if data_contract_spec.models is None or len(data_contract_spec.models.items()) != 1:
-        print(f"Export to dbt-staging-sql currently only works with exactly one model in the data contract.")
+        print("Export to dbt-staging-sql currently only works with exactly one model in the data contract.")
         return ""
     id = data_contract_spec.id
@@ -39,15 +36,10 @@ def to_dbt_staging_sql(data_contract_spec: DataContractSpecification, model_name
 def to_dbt_sources_yaml(data_contract_spec: DataContractSpecification, server: str = None):
-    source = {
-        "name": data_contract_spec.id,
-        "tables": []
-    }
+    source = {"name": data_contract_spec.id, "tables": []}
     dbt = {
         "version": 2,
-        "sources": [
-            source
-        ],
+        "sources": [source],
     }
     if data_contract_spec.info.owner is not None:
         source["meta"] = {"owner": data_contract_spec.info.owner}
@@ -82,20 +74,14 @@ def _to_dbt_model(model_key, model_value: Model, data_contract_spec: DataContrac
         "name": model_key,
     }
     model_type = _to_dbt_model_type(model_value.type)
-    dbt_model["config"] = {
-        "meta": {
-            "data_contract": data_contract_spec.id
-        }
-    }
+    dbt_model["config"] = {"meta": {"data_contract": data_contract_spec.id}}
     dbt_model["config"]["materialized"] = model_type
     if data_contract_spec.info.owner is not None:
         dbt_model["config"]["meta"]["owner"] = data_contract_spec.info.owner
     if _supports_constraints(model_type):
-        dbt_model["config"]["contract"] = {
-            "enforced": True
-        }
+        dbt_model["config"]["contract"] = {"enforced": True}
     if model_value.description is not None:
         dbt_model["description"] = model_value.description
     columns = _to_columns(model_value.fields, _supports_constraints(model_type), True)
@@ -138,8 +124,8 @@ def _to_column(field: Field, supports_constraints: bool, supports_datatype: bool
             column["data_type"] = dbt_type
         else:
             column.setdefault("tests", []).append(
-                {"dbt_expectations.dbt_expectations.expect_column_values_to_be_of_type": {
-                    "column_type": dbt_type}})
+                {"dbt_expectations.dbt_expectations.expect_column_values_to_be_of_type": {"column_type": dbt_type}}
+            )
     if field.description is not None:
         column["description"] = field.description
     if field.required:
@@ -161,7 +147,8 @@ def _to_column(field: Field, supports_constraints: bool, supports_datatype: bool
         if field.maxLength is not None:
             length_test["max_value"] = field.maxLength
         column.setdefault("tests", []).append(
-            {"dbt_expectations.expect_column_value_lengths_to_be_between": length_test})
+            {"dbt_expectations.expect_column_value_lengths_to_be_between": length_test}
+        )
     if field.pii is not None:
         column.setdefault("meta", {})["pii"] = field.pii
     if field.classification is not None:
@@ -171,15 +158,26 @@ def _to_column(field: Field, supports_constraints: bool, supports_datatype: bool
     if field.pattern is not None:
         # Beware, the data contract pattern is a regex, not a like pattern
         column.setdefault("tests", []).append(
-            {"dbt_expectations.expect_column_values_to_match_regex": {"regex": field.pattern}})
-    if field.minimum is not None or field.maximum is not None and field.exclusiveMinimum is None and field.exclusiveMaximum is None:
+            {"dbt_expectations.expect_column_values_to_match_regex": {"regex": field.pattern}}
+        )
+    if (
+        field.minimum is not None
+        or field.maximum is not None
+        and field.exclusiveMinimum is None
+        and field.exclusiveMaximum is None
+    ):
         range_test = {}
         if field.minimum is not None:
             range_test["min_value"] = field.minimum
         if field.maximum is not None:
             range_test["max_value"] = field.maximum
         column.setdefault("tests", []).append({"dbt_expectations.expect_column_values_to_be_between": range_test})
-    elif field.exclusiveMinimum is not None or field.exclusiveMaximum is not None and field.minimum is None and field.maximum is None:
+    elif (
+        field.exclusiveMinimum is not None
+        or field.exclusiveMaximum is not None
+        and field.minimum is None
+        and field.maximum is None
+    ):
         range_test = {}
         if field.exclusiveMinimum is not None:
             range_test["min_value"] = field.exclusiveMinimum
@@ -190,17 +188,30 @@ def _to_column(field: Field, supports_constraints: bool, supports_datatype: bool
     else:
         if field.minimum is not None:
             column.setdefault("tests", []).append(
-                {"dbt_expectations.expect_column_values_to_be_between": {"min_value": field.minimum}})
+                {"dbt_expectations.expect_column_values_to_be_between": {"min_value": field.minimum}}
+            )
         if field.maximum is not None:
             column.setdefault("tests", []).append(
-                {"dbt_expectations.expect_column_values_to_be_between": {"max_value": field.maximum}})
+                {"dbt_expectations.expect_column_values_to_be_between": {"max_value": field.maximum}}
+            )
         if field.exclusiveMinimum is not None:
-            column.setdefault("tests", []).append({"dbt_expectations.expect_column_values_to_be_between": {
-                "min_value": field.exclusiveMinimum, "strictly": True}})
+            column.setdefault("tests", []).append(
+                {
+                    "dbt_expectations.expect_column_values_to_be_between": {
+                        "min_value": field.exclusiveMinimum,
+                        "strictly": True,
+                    }
+                }
+            )
         if field.exclusiveMaximum is not None:
-            column.setdefault("tests", []).append({"dbt_expectations.expect_column_values_to_be_between": {
-                "max_value": field.exclusiveMaximum, "strictly": True}})
+            column.setdefault("tests", []).append(
+                {
+                    "dbt_expectations.expect_column_values_to_be_between": {
+                        "max_value": field.exclusiveMaximum,
+                        "strictly": True,
+                    }
+                }
+            )
     # TODO: all constraints
     return column

datacontract/export/great_expectations_converter.py ADDED Viewed

@@ -0,0 +1,141 @@
+import json
+from typing import Dict, List, Any
+import yaml
+from datacontract.model.data_contract_specification import \
+    DataContractSpecification, Field, Quality
+def to_great_expectations(data_contract_spec: DataContractSpecification, model_key: str) -> str:
+    """
+    Convert each model in the contract to a Great Expectation suite
+    @param data_contract_spec: data contract to export to great expectations
+    @param model_key: model to great expectations to
+    @return: a dictionary of great expectation suites
+    """
+    expectations = []
+    model_value = data_contract_spec.models.get(model_key)
+    quality_checks = get_quality_checks(data_contract_spec.quality)
+    expectations.extend(model_to_expectations(model_value.fields))
+    expectations.extend(checks_to_expectations(quality_checks, model_key))
+    model_expectation_suite = to_suite(model_key, data_contract_spec.info.version, expectations)
+    return model_expectation_suite
+def to_suite(
+    model_key: str,
+    contract_version: str,
+    expectations: List[Dict[str, Any]],
+) -> str:
+    return json.dumps(
+        {
+            "data_asset_type": "null",
+            "expectation_suite_name": "user-defined.{model_key}.{contract_version}".format(
+                model_key=model_key, contract_version=contract_version
+            ),
+            "expectations": expectations,
+            "meta": {},
+        },
+        indent=2,
+    )
+def model_to_expectations(fields: Dict[str, Field]) -> List[Dict[str, Any]]:
+    """
+    Convert the model information to expectations
+    @param fields: model field
+    @return: list of expectations
+    """
+    expectations = []
+    add_column_order_exp(fields, expectations)
+    for field_name, field in fields.items():
+        add_field_expectations(field_name, field, expectations)
+    return expectations
+def add_field_expectations(field_name, field: Field, expectations: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+    if field.type is not None:
+        expectations.append(to_column_types_exp(field_name, field.type))
+    if field.unique:
+        expectations.append(to_column_unique_exp(field_name))
+    if field.maxLength is not None or field.minLength is not None:
+        expectations.append(to_column_length_exp(field_name, field.minLength, field.maxLength))
+    if field.minimum is not None or field.maximum is not None:
+        expectations.append(to_column_min_max_exp(field_name, field.minimum, field.maximum))
+    # TODO: all constraints
+    return expectations
+def add_column_order_exp(fields: Dict[str, Field], expectations: List[Dict[str, Any]]):
+    expectations.append(
+        {
+            "expectation_type": "expect_table_columns_to_match_ordered_list",
+            "kwargs": {"column_list": list(fields.keys())},
+            "meta": {},
+        }
+    )
+def to_column_types_exp(field_name, field_type) -> Dict[str, Any]:
+    return {
+        "expectation_type": "expect_column_values_to_be_of_type",
+        "kwargs": {"column": field_name, "type_": field_type},
+        "meta": {},
+    }
+def to_column_unique_exp(field_name) -> Dict[str, Any]:
+    return {"expectation_type": "expect_column_values_to_be_unique", "kwargs": {"column": field_name}, "meta": {}}
+def to_column_length_exp(field_name, min_length, max_length) -> Dict[str, Any]:
+    return {
+        "expectation_type": "expect_column_value_lengths_to_be_between",
+        "kwargs": {"column": field_name, "min_value": min_length, "max_value": max_length},
+        "meta": {},
+    }
+def to_column_min_max_exp(field_name, minimum, maximum) -> Dict[str, Any]:
+    return {
+        "expectation_type": "expect_column_values_to_be_between",
+        "kwargs": {"column": field_name, "min_value": minimum, "max_value": maximum},
+        "meta": {},
+    }
+def get_quality_checks(quality: Quality) -> Dict[str, Any]:
+    if quality is None:
+        return {}
+    if quality.type is None:
+        return {}
+    if quality.type.lower() != "great-expectations":
+        return {}
+    if isinstance(quality.specification, str):
+        quality_specification = yaml.safe_load(quality.specification)
+    else:
+        quality_specification = quality.specification
+    return quality_specification
+def checks_to_expectations(quality_checks: Dict[str, Any], model_key: str) -> List[Dict[str, Any]]:
+    """
+    Get the quality definition for each model to the model expectation list
+    @param quality_checks: dictionary of quality checks by model
+    @param model_key: id of the model
+    @return: the list of expectations for that model
+    """
+    if quality_checks is None or model_key not in quality_checks:
+        return []
+    model_quality_checks = quality_checks[model_key]
+    if model_quality_checks is None:
+        return []
+    if isinstance(model_quality_checks, str):
+        expectation_list = json.loads(model_quality_checks)
+        return expectation_list

datacontract/export/html_export.py ADDED Viewed

@@ -0,0 +1,46 @@
+import yaml
+from jinja2 import Environment, PackageLoader, select_autoescape
+from datacontract.model.data_contract_specification import \
+    DataContractSpecification
+def to_html(data_contract_spec: DataContractSpecification) -> str:
+    # Load templates from templates folder
+    package_loader = PackageLoader("datacontract", "templates")
+    env = Environment(
+        loader=package_loader,
+        autoescape=select_autoescape(
+            enabled_extensions=("html", "xml"),
+            default_for_string=True,
+        ),
+    )
+    # Load the required template
+    template = env.get_template("datacontract.html")
+    if data_contract_spec.quality is not None and isinstance(data_contract_spec.quality.specification, str):
+        quality_specification = data_contract_spec.quality.specification
+    elif data_contract_spec.quality is not None and isinstance(data_contract_spec.quality.specification, object):
+        if data_contract_spec.quality.type == "great-expectations":
+            quality_specification = yaml.dump(
+                data_contract_spec.quality.specification, sort_keys=False, default_style="|"
+            )
+        else:
+            quality_specification = yaml.dump(data_contract_spec.quality.specification, sort_keys=False)
+    else:
+        quality_specification = None
+    style_content, _, _ = package_loader.get_source(env, "style/output.css")
+    datacontract_yaml = data_contract_spec.to_yaml()
+    # Render the template with necessary data
+    html_string = template.render(
+        datacontract=data_contract_spec,
+        quality_specification=quality_specification,
+        style=style_content,
+        datacontract_yaml=datacontract_yaml,
+    )
+    return html_string

datacontract/export/jsonschema_converter.py CHANGED Viewed

@@ -12,16 +12,18 @@ def to_jsonschemas(data_contract_spec: DataContractSpecification):
         jsonschmemas[model_key] = jsonschema
     return jsonschmemas
 def to_jsonschema_json(model_key, model_value: Model) -> str:
     jsonschema = to_jsonschema(model_key, model_value)
     return json.dumps(jsonschema, indent=2)
 def to_jsonschema(model_key, model_value: Model) -> dict:
     return {
         "$schema": "http://json-schema.org/draft-07/schema#",
         "type": "object",
         "properties": to_properties(model_value.fields),
-        "required": to_required(model_value.fields)
+        "required": to_required(model_value.fields),
     }

datacontract/export/odcs_converter.py CHANGED Viewed

@@ -27,10 +27,12 @@ def to_odcs_yaml(data_contract_spec: DataContractSpecification):
         odcs["description"] = {
             "purpose": None,
             "usage": data_contract_spec.terms.usage.strip() if data_contract_spec.terms.usage is not None else None,
-            "limitations": data_contract_spec.terms.limitations.strip() if data_contract_spec.terms.limitations is not None else None,
+            "limitations": data_contract_spec.terms.limitations.strip()
+            if data_contract_spec.terms.limitations is not None
+            else None,
         }
-    odcs["type"] = "tables" # required, TODO read from models.type?
+    odcs["type"] = "tables"  # required, TODO read from models.type?
     odcs["dataset"] = []
     for model_key, model_value in data_contract_spec.models.items():
@@ -62,9 +64,7 @@ def to_columns(fields: Dict[str, Field]) -> list:
 def to_column(field_name: str, field: Field) -> dict:
-    column = {
-        "column": field_name
-    }
+    column = {"column": field_name}
     if field.type is not None:
         column["logicalType"] = field.type
         column["physicalType"] = field.type
@@ -100,5 +100,3 @@ def to_column(field_name: str, field: Field) -> dict:
     # todo enum
     return column

datacontract-cli 0.9.7__py3-none-any.whl → 0.9.9__py3-none-any.whl

Potentially problematic release.

datacontract-cli 0.9.7py3-none-any.whl → 0.9.9py3-none-any.whl