PyPI - dcs-sdk - Versions diffs - 1.6.5__py3-none-any.whl - Mend

dcs-sdk 1.6.5__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (159) hide show

data_diff/__init__.py +221 -0
data_diff/__main__.py +517 -0
data_diff/abcs/__init__.py +13 -0
data_diff/abcs/compiler.py +27 -0
data_diff/abcs/database_types.py +402 -0
data_diff/config.py +141 -0
data_diff/databases/__init__.py +38 -0
data_diff/databases/_connect.py +323 -0
data_diff/databases/base.py +1417 -0
data_diff/databases/bigquery.py +376 -0
data_diff/databases/clickhouse.py +217 -0
data_diff/databases/databricks.py +262 -0
data_diff/databases/duckdb.py +207 -0
data_diff/databases/mssql.py +343 -0
data_diff/databases/mysql.py +189 -0
data_diff/databases/oracle.py +238 -0
data_diff/databases/postgresql.py +293 -0
data_diff/databases/presto.py +222 -0
data_diff/databases/redis.py +93 -0
data_diff/databases/redshift.py +233 -0
data_diff/databases/snowflake.py +222 -0
data_diff/databases/sybase.py +720 -0
data_diff/databases/trino.py +73 -0
data_diff/databases/vertica.py +174 -0
data_diff/diff_tables.py +489 -0
data_diff/errors.py +17 -0
data_diff/format.py +369 -0
data_diff/hashdiff_tables.py +1026 -0
data_diff/info_tree.py +76 -0
data_diff/joindiff_tables.py +434 -0
data_diff/lexicographic_space.py +253 -0
data_diff/parse_time.py +88 -0
data_diff/py.typed +0 -0
data_diff/queries/__init__.py +13 -0
data_diff/queries/api.py +213 -0
data_diff/queries/ast_classes.py +811 -0
data_diff/queries/base.py +38 -0
data_diff/queries/extras.py +43 -0
data_diff/query_utils.py +70 -0
data_diff/schema.py +67 -0
data_diff/table_segment.py +583 -0
data_diff/thread_utils.py +112 -0
data_diff/utils.py +1022 -0
data_diff/version.py +15 -0
dcs_core/__init__.py +13 -0
dcs_core/__main__.py +17 -0
dcs_core/__version__.py +15 -0
dcs_core/cli/__init__.py +13 -0
dcs_core/cli/cli.py +165 -0
dcs_core/core/__init__.py +19 -0
dcs_core/core/common/__init__.py +13 -0
dcs_core/core/common/errors.py +50 -0
dcs_core/core/common/models/__init__.py +13 -0
dcs_core/core/common/models/configuration.py +284 -0
dcs_core/core/common/models/dashboard.py +24 -0
dcs_core/core/common/models/data_source_resource.py +75 -0
dcs_core/core/common/models/metric.py +160 -0
dcs_core/core/common/models/profile.py +75 -0
dcs_core/core/common/models/validation.py +216 -0
dcs_core/core/common/models/widget.py +44 -0
dcs_core/core/configuration/__init__.py +13 -0
dcs_core/core/configuration/config_loader.py +139 -0
dcs_core/core/configuration/configuration_parser.py +262 -0
dcs_core/core/configuration/configuration_parser_arc.py +328 -0
dcs_core/core/datasource/__init__.py +13 -0
dcs_core/core/datasource/base.py +62 -0
dcs_core/core/datasource/manager.py +112 -0
dcs_core/core/datasource/search_datasource.py +421 -0
dcs_core/core/datasource/sql_datasource.py +1094 -0
dcs_core/core/inspect.py +163 -0
dcs_core/core/logger/__init__.py +13 -0
dcs_core/core/logger/base.py +32 -0
dcs_core/core/logger/default_logger.py +94 -0
dcs_core/core/metric/__init__.py +13 -0
dcs_core/core/metric/base.py +220 -0
dcs_core/core/metric/combined_metric.py +98 -0
dcs_core/core/metric/custom_metric.py +34 -0
dcs_core/core/metric/manager.py +137 -0
dcs_core/core/metric/numeric_metric.py +403 -0
dcs_core/core/metric/reliability_metric.py +90 -0
dcs_core/core/profiling/__init__.py +13 -0
dcs_core/core/profiling/datasource_profiling.py +136 -0
dcs_core/core/profiling/numeric_field_profiling.py +72 -0
dcs_core/core/profiling/text_field_profiling.py +67 -0
dcs_core/core/repository/__init__.py +13 -0
dcs_core/core/repository/metric_repository.py +77 -0
dcs_core/core/utils/__init__.py +13 -0
dcs_core/core/utils/log.py +29 -0
dcs_core/core/utils/tracking.py +105 -0
dcs_core/core/utils/utils.py +44 -0
dcs_core/core/validation/__init__.py +13 -0
dcs_core/core/validation/base.py +230 -0
dcs_core/core/validation/completeness_validation.py +153 -0
dcs_core/core/validation/custom_query_validation.py +24 -0
dcs_core/core/validation/manager.py +282 -0
dcs_core/core/validation/numeric_validation.py +276 -0
dcs_core/core/validation/reliability_validation.py +91 -0
dcs_core/core/validation/uniqueness_validation.py +61 -0
dcs_core/core/validation/validity_validation.py +738 -0
dcs_core/integrations/__init__.py +13 -0
dcs_core/integrations/databases/__init__.py +13 -0
dcs_core/integrations/databases/bigquery.py +187 -0
dcs_core/integrations/databases/databricks.py +51 -0
dcs_core/integrations/databases/db2.py +652 -0
dcs_core/integrations/databases/elasticsearch.py +61 -0
dcs_core/integrations/databases/mssql.py +829 -0
dcs_core/integrations/databases/mysql.py +409 -0
dcs_core/integrations/databases/opensearch.py +64 -0
dcs_core/integrations/databases/oracle.py +719 -0
dcs_core/integrations/databases/postgres.py +482 -0
dcs_core/integrations/databases/redshift.py +53 -0
dcs_core/integrations/databases/snowflake.py +48 -0
dcs_core/integrations/databases/spark_df.py +111 -0
dcs_core/integrations/databases/sybase.py +1069 -0
dcs_core/integrations/storage/__init__.py +13 -0
dcs_core/integrations/storage/local_file.py +149 -0
dcs_core/integrations/utils/__init__.py +13 -0
dcs_core/integrations/utils/utils.py +36 -0
dcs_core/report/__init__.py +13 -0
dcs_core/report/dashboard.py +211 -0
dcs_core/report/models.py +88 -0
dcs_core/report/static/assets/fonts/DMSans-Bold.ttf +0 -0
dcs_core/report/static/assets/fonts/DMSans-Medium.ttf +0 -0
dcs_core/report/static/assets/fonts/DMSans-Regular.ttf +0 -0
dcs_core/report/static/assets/fonts/DMSans-SemiBold.ttf +0 -0
dcs_core/report/static/assets/images/docs.svg +6 -0
dcs_core/report/static/assets/images/github.svg +4 -0
dcs_core/report/static/assets/images/logo.svg +7 -0
dcs_core/report/static/assets/images/slack.svg +13 -0
dcs_core/report/static/index.js +2 -0
dcs_core/report/static/index.js.LICENSE.txt +3971 -0
dcs_sdk/__init__.py +13 -0
dcs_sdk/__main__.py +18 -0
dcs_sdk/__version__.py +15 -0
dcs_sdk/cli/__init__.py +13 -0
dcs_sdk/cli/cli.py +163 -0
dcs_sdk/sdk/__init__.py +58 -0
dcs_sdk/sdk/config/__init__.py +13 -0
dcs_sdk/sdk/config/config_loader.py +491 -0
dcs_sdk/sdk/data_diff/__init__.py +13 -0
dcs_sdk/sdk/data_diff/data_differ.py +821 -0
dcs_sdk/sdk/rules/__init__.py +15 -0
dcs_sdk/sdk/rules/rules_mappping.py +31 -0
dcs_sdk/sdk/rules/rules_repository.py +214 -0
dcs_sdk/sdk/rules/schema_rules.py +65 -0
dcs_sdk/sdk/utils/__init__.py +13 -0
dcs_sdk/sdk/utils/serializer.py +25 -0
dcs_sdk/sdk/utils/similarity_score/__init__.py +13 -0
dcs_sdk/sdk/utils/similarity_score/base_provider.py +153 -0
dcs_sdk/sdk/utils/similarity_score/cosine_similarity_provider.py +39 -0
dcs_sdk/sdk/utils/similarity_score/jaccard_provider.py +24 -0
dcs_sdk/sdk/utils/similarity_score/levenshtein_distance_provider.py +31 -0
dcs_sdk/sdk/utils/table.py +475 -0
dcs_sdk/sdk/utils/themes.py +40 -0
dcs_sdk/sdk/utils/utils.py +349 -0
dcs_sdk-1.6.5.dist-info/METADATA +150 -0
dcs_sdk-1.6.5.dist-info/RECORD +159 -0
dcs_sdk-1.6.5.dist-info/WHEEL +4 -0
dcs_sdk-1.6.5.dist-info/entry_points.txt +4 -0

dcs_core/core/validation/validity_validation.py ADDED Viewed

@@ -0,0 +1,738 @@
+#  Copyright 2022-present, the Waterdip Labs Pvt. Ltd.
+#
+#  Licensed under the Apache License, Version 2.0 (the "License");
+#  you may not use this file except in compliance with the License.
+#  You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+#  Unless required by applicable law or agreed to in writing, software
+#  distributed under the License is distributed on an "AS IS" BASIS,
+#  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+#  See the License for the specific language governing permissions and
+#  limitations under the License.
+import re
+from typing import Union
+from dcs_core.core.datasource.search_datasource import SearchIndexDataSource
+from dcs_core.core.datasource.sql_datasource import SQLDataSource
+from dcs_core.core.validation.base import Validation
+from dcs_core.integrations.databases.oracle import OracleDataSource
+class CountUUIDValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="uuid",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("UUID validation is only supported for SQL data sources")
+class PercentUUIDValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="uuid",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("UUID validation is only supported for SQL data sources")
+class CountInvalidValues(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.values is None:
+            raise ValueError("Values are required for count_invalid_values validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                invalid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                values=self.values,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return invalid_count
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class PercentInvalidValues(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.values is None:
+            raise ValueError("Values are required for percent_invalid_values validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                invalid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                values=self.values,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(invalid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class CountValidValues(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.values is None:
+            raise ValueError("Values are required for count_valid_values validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                values=self.values,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class PercentValidValues(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.values is None:
+            raise ValueError("Values are required for percent_valid_values validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                values=self.values,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class CountInvalidRegex(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.regex_pattern is None:
+            raise ValueError("Regex pattern is required for count_invalid_regex validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                invalid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                regex_pattern=self.regex_pattern,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return invalid_count
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class PercentInvalidRegex(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.regex_pattern is None:
+            raise ValueError("Regex pattern is required for percent_invalid_regex validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                invalid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                regex_pattern=self.regex_pattern,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(invalid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class CountValidRegex(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.regex_pattern is None:
+            raise ValueError("Regex pattern is required for count_valid_regex validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                regex_pattern=self.regex_pattern,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class PercentValidRegex(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if self.regex_pattern is None:
+            raise ValueError("Regex pattern is required for percent_valid_regex validation")
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_valid_invalid_values_validity(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                regex_pattern=self.regex_pattern,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Valid/Invalid values validation is only supported for SQL data sources")
+class CountUSAPhoneValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_phone",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        elif isinstance(self.data_source, SearchIndexDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                index_name=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_phone",
+                filters=self.where_filter if self.where_filter else None,
+            )
+            return valid_count
+        else:
+            raise ValueError("Invalid data source type")
+class PercentUSAPhoneValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_phone",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        elif isinstance(self.data_source, SearchIndexDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                index_name=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_phone",
+                filters=self.where_filter if self.where_filter else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise ValueError("Invalid data source type")
+class CountEmailValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="email",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("Email validation is only supported for SQL data sources")
+class PercentEmailValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="email",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Email validation is only supported for SQL data sources")
+class StringLengthMaxValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            return self.data_source.query_get_string_length_metric(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                metric="max",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for StringLengthMaxValidation")
+class StringLengthMinValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            return self.data_source.query_get_string_length_metric(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                metric="min",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for StringLengthMinValidation")
+class StringLengthAverageValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter)
+            return self.data_source.query_get_string_length_metric(
+                table=self.dataset_name,
+                field=f'"{self.field_name}"' if isinstance(self.data_source, OracleDataSource) else self.field_name,
+                metric="avg",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for StringLengthAverageValidation")
+class CountUSAZipCodeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_zip_code",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("USA Zip Code validation is only supported for SQL data sources")
+class PercentUSAZipCodeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="usa_zip_code",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("USA Zip Code validation is only supported for SQL data sources")
+class CountUSAStateCodeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_get_usa_state_code_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("USA State Code validation is only supported for SQL data sources")
+class PercentUSAStateCodeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_count,
+            ) = self.data_source.query_get_usa_state_code_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("USA State Code validation is only supported for SQL data sources")
+class CountLatitudeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            return self.data_source.query_geolocation_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                operation="count",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for CountLatitudeValidation")
+class PercentLatitudeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            return self.data_source.query_geolocation_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                operation="percent",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for PercentLatitudeValidation")
+class CountLongitudeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            return self.data_source.query_geolocation_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                operation="count",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for CountLongitudeValidation")
+class PercentLongitudeValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            return self.data_source.query_geolocation_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                operation="percent",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+        else:
+            raise ValueError("Unsupported data source type for PercentLongitudeValidation")
+class CountSSNValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="ssn",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("SSN values validation is only supported for SQL data sources")
+class PercentSSNValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="ssn",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("SSN values validation is only supported for SQL data sources")
+class CountSEDOLValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="sedol",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("SEDOL validation is only supported for SQL data sources")
+class PercentSEDOLValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="sedol",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("SEDOL validation is only supported for SQL data sources")
+class CountCUSIPValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="cusip",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("CUSIP validation is only supported for SQL data sources")
+class PercentCUSIPValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="cusip",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("CUSIP validation is only supported for SQL data sources")
+class CountLEIValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="lei",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("LEI validation is only supported for SQL data sources")
+class PercentLEIValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="lei",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("LEI validation is only supported for SQL data sources")
+class CountFIGIValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="figi",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("FIGI validation is only supported for SQL data sources")
+class PercentFIGIValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="figi",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("FIGI validation is only supported for SQL data sources")
+class CountISINValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="isin",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("ISIN validation is only supported for SQL data sources")
+class PercentISINValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="isin",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("ISIN validation is only supported for SQL data sources")
+class CountPermIDValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="perm_id",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise NotImplementedError("Perm ID validation is only supported for SQL data sources")
+class PercentPermIDValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_count = self.data_source.query_string_pattern_validity(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex_pattern="perm_id",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round(valid_count / total_count * 100, 2) if total_count > 0 else 0
+        else:
+            raise NotImplementedError("Perm ID validation is only supported for SQL data sources")
+class CountTimeStampValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_row_count = self.data_source.query_timestamp_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise ValueError("Unsupported data source type for CountTimeStampValidation")
+class PercentTimeStampValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            valid_count, total_row_count = self.data_source.query_timestamp_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round((valid_count / total_row_count) * 100, 2) if total_row_count > 0 else 0.0
+        else:
+            raise ValueError("Unsupported data source type for PercentTimeStampValidation")
+class CountNotInFutureValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_row_count,
+            ) = self.data_source.query_timestamp_not_in_future_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise ValueError("Unsupported data source type for CountNotInFutureValidation")
+class PercentNotInFutureValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_row_count,
+            ) = self.data_source.query_timestamp_not_in_future_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round((valid_count / total_row_count) * 100, 2) if total_row_count > 0 else 0.0
+        else:
+            raise ValueError("Unsupported data source type for PercentNotInFutureValidation")
+class CountDateNotInFutureValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_row_count,
+            ) = self.data_source.query_timestamp_date_not_in_future_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return valid_count
+        else:
+            raise ValueError("Unsupported data source type for CountDateNotInFutureValidation")
+class PercentDateNotInFutureValidation(Validation):
+    def _generate_metric_value(self, **kwargs) -> Union[float, int]:
+        if isinstance(self.data_source, SQLDataSource):
+            (
+                valid_count,
+                total_row_count,
+            ) = self.data_source.query_timestamp_date_not_in_future_metric(
+                table=self.dataset_name,
+                field=self.field_name,
+                predefined_regex="timestamp_iso",
+                filters=self.where_filter if self.where_filter is not None else None,
+            )
+            return round((valid_count / total_row_count) * 100, 2) if total_row_count > 0 else 0.0
+        else:
+            raise ValueError("Unsupported data source type for PercentDateNotInFutureValidation")