PyPI - acryl-datahub-cloud - Versions diffs - 0.3.8.2rc4__py3-none-any.whl → 0.3.8.2rc5__py3-none-any.whl - Mend

acryl-datahub-cloud 0.3.8.2rc4py3-none-any.whl → 0.3.8.2rc5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of acryl-datahub-cloud might be problematic. Click here for more details.

Files changed (10) hide show

acryl_datahub_cloud/_codegen_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "acryl-datahub-cloud",
-  "version": "0.3.8.2rc4",
+  "version": "0.3.8.2rc5",
   "install_requires": [
     "avro-gen3==0.7.16",
     "acryl-datahub"

acryl_datahub_cloud/datahub_usage_reporting/query_builder.py CHANGED Viewed

@@ -13,6 +13,7 @@ class QueryBuilder:
                     "removed",
                     "siblings",
                     "typeNames",
+                    "combinedSearchRankingMultiplier",
                 ]
             },
         }

acryl_datahub_cloud/datahub_usage_reporting/usage_feature_reporter.py CHANGED Viewed

@@ -172,6 +172,15 @@ class DataHubUsageFeatureReportingSourceConfig(
         description="Flag to enable polars streaming mode.'",
     )
+    # Running the whole pipeline in streaming mode was very unstable in the past.
+    # It seems like with the latest version of Polars it is much more stable.
+    # This option is only needed here until we are sure that the streaming mode is stable.
+    # then we can remove it and control it with the streaming_mode option.
+    experimental_full_streaming: bool = Field(
+        False,
+        description="Flag to enable full streaming mode.'",
+    )
     disable_write_usage: bool = Field(
         True,
         description="Flag to disable write usage statistics collection.'",
@@ -300,6 +309,12 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
                         if "siblings" in doc["_source"] and doc["_source"]["siblings"]
                         else []
                     ),
+                    "combinedSearchRankingMultiplier": (
+                        doc["_source"]["combinedSearchRankingMultiplier"]
+                        if "combinedSearchRankingMultiplier" in doc["_source"]
+                        and doc["_source"]["combinedSearchRankingMultiplier"]
+                        else None
+                    ),
                     "isView": (
                         "View" in doc["_source"]["typeNames"]
                         if "typeNames" in doc["_source"] and doc["_source"]["typeNames"]
@@ -544,9 +559,10 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             usageSearchScoreMultiplier=usage_search_score_multiplier,
             usageFreshnessScoreMultiplier=freshness_factor,
             customDatahubScoreMultiplier=regexp_factor,
-            combinedSearchRankingMultiplier=usage_search_score_multiplier
-            * freshness_factor
-            * regexp_factor,
+            # We make sure the combinedSearchRankingMultiplier is never less than 1
+            combinedSearchRankingMultiplier=max(
+                1, (usage_search_score_multiplier * freshness_factor * regexp_factor)
+            ),
         )
     def load_data_from_es(
@@ -968,7 +984,9 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
         self, lazy_frame: polars.LazyFrame
     ) -> Iterable[MetadataWorkUnit]:
         num = 0
-        for row in lazy_frame.collect().to_struct():
+        for row in lazy_frame.collect(
+            streaming=self.config.experimental_full_streaming
+        ).to_struct():
             num += 1
             if "siblings" in row and row["siblings"]:
@@ -979,113 +997,68 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             )
             if "queries_rank_percentile" in row:
-                search_ranking_multipliers = self.search_score(
-                    urn=row["urn"],
-                    last_update_time=(
-                        row["last_modified_at"]
-                        if "last_modified_at" in row and row["last_modified_at"]
-                        else 0
-                    ),
-                    usage_percentile=(
-                        row["queries_rank_percentile"]
-                        if row["queries_rank_percentile"]
-                        else 0
-                    ),
+                # If usage data is missing we set the search ranking multipliers to 1
+                search_ranking_multipliers = (
+                    self.search_score(
+                        urn=row["urn"],
+                        last_update_time=row.get("last_modified_at", 0) or 0,
+                        usage_percentile=row.get("queries_rank_percentile", 0) or 0,
+                    )
+                    if row.get("queries_rank_percentile", 0)
+                    else SearchRankingMultipliers()
                 )
             elif "viewsCount30Days_rank_percentile" in row:
-                search_ranking_multipliers = self.search_score(
-                    urn=row["urn"],
-                    last_update_time=(
-                        row["last_modified_at"]
-                        if "last_modified_at" in row and row["last_modified_at"]
-                        else 0
-                    ),
-                    usage_percentile=(
-                        row["viewsCount30Days_rank_percentile"]
-                        if row["viewsCount30Days_rank_percentile"]
-                        else 0
-                    ),
+                # If usage data is missing we set the search ranking multipliers to 1
+                search_ranking_multipliers = (
+                    self.search_score(
+                        urn=row["urn"],
+                        last_update_time=row.get("last_modified_at", 0) or 0,
+                        usage_percentile=row.get("viewsCount30Days_rank_percentile", 0)
+                        or 0,
+                    )
+                    if row.get("viewsCount30Days_rank_percentile", 0)
+                    else SearchRankingMultipliers()
                 )
                 logger.debug(f"Urn: {row['urn']} Score: {search_ranking_multipliers}")
             usage_feature = UsageFeaturesClass(
-                queryCountLast30Days=(
-                    int(row["totalSqlQueries"])
-                    if "totalSqlQueries" in row and row["totalSqlQueries"]
-                    else 0
-                ),
-                usageCountLast30Days=(
-                    int(row["totalSqlQueries"])
-                    if "totalSqlQueries" in row and row["totalSqlQueries"]
-                    else 0
-                ),
-                queryCountRankLast30Days=(
-                    int(row["queries_rank"])
-                    if "queries_rank" in row and row["queries_rank"] is not None
-                    else None
-                ),
-                queryCountPercentileLast30Days=(
-                    int(row["queries_rank_percentile"])
-                    if "queries_rank_percentile" in row
-                    and row["queries_rank_percentile"]
-                    else 0
-                ),
+                queryCountLast30Days=int(row.get("totalSqlQueries", 0) or 0),
+                usageCountLast30Days=int(row.get("totalSqlQueries", 0) or 0),
+                queryCountRankLast30Days=int(row.get("queries_rank"))
+                if row.get("queries_rank")
+                else None,
+                queryCountPercentileLast30Days=row.get("queries_rank_percentile", 0)
+                or 0,
                 # queryCountPercentileLast30Days=int(
                 #   row["queries_rank_percentile"]) if "queries_rank_percentile" in row and row[
                 #   "queries_rank_percentile"] else 0,
                 topUsersLast30Days=(
-                    list(chain.from_iterable(row["top_users"]))
-                    if row["top_users"]
-                    else None
-                ),
-                uniqueUserCountLast30Days=(
-                    int(row["distinct_user"]) if row["distinct_user"] else 0
-                ),
-                uniqueUserRankLast30Days=(
-                    int(row["distinct_user_rank"])
-                    if "distinct_user_rank" in row
-                    and row["distinct_user_rank"] is not None
-                    else None
-                ),
-                uniqueUserPercentileLast30Days=(
-                    int(row["distinct_user_rank_percentile"])
-                    if "distinct_user_rank_percentile" in row
-                    and row["distinct_user_rank_percentile"]
-                    else 0
-                ),
-                writeCountLast30Days=(
-                    int(row["write_count"])
-                    if "write_count" in row and row["write_count"]
-                    else 0
-                    if not self.config.disable_write_usage
-                    else None
-                ),
-                writeCountPercentileLast30Days=(
-                    int(row["write_rank_percentile"])
-                    if "write_count" in row and row["write_rank_percentile"]
-                    else 0
-                    if not self.config.disable_write_usage
+                    list(chain.from_iterable(row.get("top_users")))
+                    if row.get("top_users")
                     else None
                 ),
-                writeCountRankLast30Days=(
-                    int(row["write_rank"])
-                    if "write_rank" in row and row["write_rank"]
-                    else None
-                ),
-                viewCountTotal=(
-                    int(row["viewsTotal"])
-                    if "viewsTotal" in row and row["viewsTotal"]
-                    else 0
+                uniqueUserCountLast30Days=int(row.get("distinct_user", 0) or 0),
+                uniqueUserRankLast30Days=int(row.get("distinct_user_rank"))
+                if row.get("distinct_user_rank")
+                else None,
+                uniqueUserPercentileLast30Days=int(
+                    row.get("distinct_user_rank_percentile", 0) or 0
                 ),
-                viewCountLast30Days=(
-                    int(row["viewsCount30Days"])
-                    if "viewsCount30Days" in row and row["viewsCount30Days"]
-                    else 0
-                ),
-                viewCountPercentileLast30Days=(
-                    int(row["viewsCount30Days_rank_percentile"])
-                    if "viewsCount30Days_rank_percentile" in row
-                    else 0
+                writeCountLast30Days=int(row.get("write_rank_percentile", 0) or 0)
+                if not self.config.disable_write_usage
+                else None,
+                writeCountPercentileLast30Days=int(
+                    row.get("write_rank_percentile", 0) or 0
+                )
+                if not self.config.disable_write_usage
+                else None,
+                writeCountRankLast30Days=int(row.get("write_rank") or 0)
+                if not self.config.disable_write_usage
+                else None,
+                viewCountTotal=int(row.get("viewsTotal", 0) or 0),
+                viewCountLast30Days=int(row.get("viewsCount30Days", 0) or 0),
+                viewCountPercentileLast30Days=int(
+                    row.get("viewsCount30Days_rank_percentile", 0) or 0
                 ),
                 usageSearchScoreMultiplier=search_ranking_multipliers.usageSearchScoreMultiplier,
                 usageFreshnessScoreMultiplier=search_ranking_multipliers.usageFreshnessScoreMultiplier,
@@ -1095,11 +1068,7 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             yield from self.generate_usage_feature_mcp(row["urn"], usage_feature)
-            if (
-                "siblings" in row
-                and row["siblings"]
-                and self.config.sibling_usage_enabled
-            ):
+            if row.get("siblings") and self.config.sibling_usage_enabled:
                 for sibling in row["siblings"]:
                     if dbt_platform_regexp.match(sibling):
                         yield from self.generate_usage_feature_mcp(
@@ -1114,26 +1083,15 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             num += 1
             query_usage_features = QueryUsageFeaturesClass(
-                queryCountLast30Days=(
-                    int(row["totalSqlQueries"])
-                    if "totalSqlQueries" in row and row["totalSqlQueries"]
-                    else 0
-                ),
+                queryCountLast30Days=int(row.get("totalSqlQueries", 0) or 0),
                 queryCountTotal=None,  # This is not implemented
-                runsPercentileLast30days=(
-                    int(row["queries_rank_percentile"])
-                    if "queries_rank_percentile" in row
-                    and row["queries_rank_percentile"]
-                    else 0
-                ),
-                lastExecutedAt=(
-                    int(row["last_modified_at"])
-                    if "last_modified_at" in row and row["last_modified_at"]
-                    else 0
+                runsPercentileLast30days=int(
+                    row.get("queries_rank_percentile", 0) or 0
                 ),
+                lastExecutedAt=int(row.get("last_modified_at", 0)),
                 topUsersLast30Days=(
-                    list(chain.from_iterable(row["top_users"]))
-                    if row["top_users"]
+                    list(chain.from_iterable(row.get("top_users", [])))
+                    if row.get("top_users")
                     else None
                 ),
                 queryCostLast30Days=None,  # Not implemented yet
@@ -1180,16 +1138,17 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
     def generate_dashboard_chart_usage(
         self, entity_index: str, usage_index: str
     ) -> polars.LazyFrame:
-        soft_deleted_schema = {
+        entity_schema = {
             "entity_urn": polars.Categorical,
             "removed": polars.Boolean,
             "last_modified_at": polars.Int64,
             "siblings": polars.List(polars.String),
+            "combinedSearchRankingMultiplier": polars.Float64,
             "isView": polars.Boolean,
         }
-        soft_deleted_df = self.load_data_from_es_to_lf(
-            schema=soft_deleted_schema,
+        entities_df = self.load_data_from_es_to_lf(
+            schema=entity_schema,
             index=entity_index,
             query=QueryBuilder.get_dataset_entities_query(),
             process_function=self.soft_deleted_batch,
@@ -1220,7 +1179,7 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
         )
         lf = (
-            lf.join(soft_deleted_df, left_on="urn", right_on="entity_urn", how="inner")
+            lf.join(entities_df, left_on="urn", right_on="entity_urn", how="inner")
             .filter(polars.col("removed") == False)  # noqa: E712
             .drop(["removed"])
         )
@@ -1268,8 +1227,10 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             )
             .drop(["first_viewsCount"])
         )
-        lf = views_sum_with_top_users.join(incremental_views_sum, on="urn", how="left")
-        lf = lf.with_columns(
+        views_with_inceremental_sum = views_sum_with_top_users.join(
+            incremental_views_sum, on="urn", how="left"
+        )
+        total_views = views_with_inceremental_sum.with_columns(
             polars.when(
                 polars.col("total_user_count")
                 .is_null()
@@ -1280,11 +1241,54 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             .alias("viewsCount30Days")
         )
-        lf = self.gen_rank_and_percentile(
-            lf, "viewsCount30Days", "urn", "platform", "viewsCount30Days_"
+        total_views_with_rank_and_percentiles = self.gen_rank_and_percentile(
+            total_views, "viewsCount30Days", "urn", "platform", "viewsCount30Days_"
+        ).drop(["siblings_right"])
+        total_views_with_rank_and_percentiles_with_zeroed_stale_usages = (
+            self.generate_empty_usage_for_stale_entities(
+                entities_df, total_views_with_rank_and_percentiles
+            )
         )
-        return lf
+        return total_views_with_rank_and_percentiles_with_zeroed_stale_usages
+    def generate_empty_usage_for_stale_entities(
+        self, entities_lf: polars.LazyFrame, usages_lf: polars.LazyFrame
+    ) -> polars.LazyFrame:
+        # We need to merge datasets with existing search scores to make sure we can downrank them if there were no usage in the last n days
+        # We drop last_modified_at to not use it in merge because we are getting last_modified_at from the usage index
+        df_with_search_scores = (
+            entities_lf.filter(
+                polars.col("combinedSearchRankingMultiplier")
+                .is_not_null()
+                # We only want to downrank datasets that have a search score multiplier greater than 1. 1 is the minimum score of a dataset
+                .and_(polars.col("combinedSearchRankingMultiplier").ne(1))
+            )  # noqa: E712
+            .filter(polars.col("removed") == False)  # noqa: E712
+            .drop(["removed"])
+            .drop(["last_modified_at"])
+            # We set this to 0 because we want to downrank datasets that have no usage
+            .with_columns(polars.lit(0).alias("combinedSearchRankingMultiplier"))
+            .rename({"entity_urn": "urn"})
+        )
+        common_fields = list(
+            set(usages_lf.columns).intersection(set(df_with_search_scores.columns))
+        )
+        usages_lf = df_with_search_scores.join(
+            usages_lf, on="urn", how="full", suffix="_right"
+        )
+        ## Merge all common fields automatically
+        for common_field in common_fields:
+            right_col = f"{common_field}_right"
+            usages_lf = usages_lf.with_columns(
+                [
+                    polars.col(common_field)
+                    .fill_null(polars.col(right_col))
+                    .alias(common_field)
+                ]
+            ).drop(right_col)
+        return usages_lf
     def generate_query_usage(self) -> polars.LazyFrame:
         usage_index = "query_queryusagestatisticsaspect_v1"
@@ -1365,16 +1369,21 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
         # Polaris/pandas join merges the join column into one column and that's why we need to filter based on the removed column
         lf = (
-            lf.join(datasets_lf, left_on="urn", right_on="entity_urn", how="inner")
+            lf.join(datasets_lf, left_on="urn", right_on="entity_urn", how="left")
             .filter(polars.col("removed") == False)  # noqa: E712
             .drop(["removed"])
         )
         total_queries = lf.group_by("urn", "platform").agg(
             polars.col("totalSqlQueries").sum(),
             polars.col("last_modified_at").max().alias("last_modified_at"),
             polars.col("siblings").first().alias("siblings"),
         )
+        total_queries = self.generate_empty_usage_for_stale_entities(
+            datasets_lf, total_queries
+        )
         top_users = self.generate_top_users(lf)
         usage_with_top_users = total_queries.join(top_users, on="urn", how="left")
@@ -1510,6 +1519,7 @@ class DataHubUsageFeatureReportingSource(StatefulIngestionSourceBase):
             "removed": polars.Boolean,
             "last_modified_at": polars.Int64,
             "siblings": polars.List(polars.String),
+            "combinedSearchRankingMultiplier": polars.Float64,
             "isView": polars.Boolean,
         }

acryl_datahub_cloud/metadata/schema.avsc CHANGED Viewed

@@ -11147,6 +11147,13 @@
         "doc": "The display name of the property. This is the name that will be shown in the UI and can be used to look up the property id."
       },
       {
+        "UrnValidation": {
+          "entityTypes": [
+            "dataType"
+          ],
+          "exist": true,
+          "strict": true
+        },
         "java": {
           "class": "com.linkedin.pegasus2avro.common.urn.Urn"
         },
@@ -11235,6 +11242,13 @@
             "fieldName": "entityTypes"
           }
         },
+        "UrnValidation": {
+          "entityTypes": [
+            "entityType"
+          ],
+          "exist": true,
+          "strict": true
+        },
         "Urn": "Urn",
         "urn_is_array": true,
         "type": {

acryl_datahub_cloud/metadata/schemas/StructuredPropertyDefinition.avsc CHANGED Viewed

@@ -23,6 +23,13 @@
       "doc": "The display name of the property. This is the name that will be shown in the UI and can be used to look up the property id."
     },
     {
+      "UrnValidation": {
+        "entityTypes": [
+          "dataType"
+        ],
+        "exist": true,
+        "strict": true
+      },
       "java": {
         "class": "com.linkedin.pegasus2avro.common.urn.Urn"
       },
@@ -111,6 +118,13 @@
           "fieldName": "entityTypes"
         }
       },
+      "UrnValidation": {
+        "entityTypes": [
+          "entityType"
+        ],
+        "exist": true,
+        "strict": true
+      },
       "type": {
         "type": "array",
         "items": "string"

{acryl_datahub_cloud-0.3.8.2rc4.dist-info → acryl_datahub_cloud-0.3.8.2rc5.dist-info}/METADATA RENAMED Viewed

@@ -1,90 +1,90 @@
 Metadata-Version: 2.2
 Name: acryl-datahub-cloud
-Version: 0.3.8.2rc4
+Version: 0.3.8.2rc5
 Requires-Dist: avro-gen3==0.7.16
 Requires-Dist: acryl-datahub
 Provides-Extra: datahub-lineage-features
+Requires-Dist: pyarrow; extra == "datahub-lineage-features"
+Requires-Dist: duckdb; extra == "datahub-lineage-features"
 Requires-Dist: opensearch-py==2.4.2; extra == "datahub-lineage-features"
 Requires-Dist: pandas; extra == "datahub-lineage-features"
 Requires-Dist: pydantic<2; extra == "datahub-lineage-features"
-Requires-Dist: duckdb; extra == "datahub-lineage-features"
-Requires-Dist: pyarrow; extra == "datahub-lineage-features"
 Provides-Extra: datahub-reporting-forms
-Requires-Dist: termcolor==2.5.0; extra == "datahub-reporting-forms"
+Requires-Dist: pyarrow; extra == "datahub-reporting-forms"
+Requires-Dist: duckdb; extra == "datahub-reporting-forms"
+Requires-Dist: boto3; extra == "datahub-reporting-forms"
 Requires-Dist: pandas; extra == "datahub-reporting-forms"
+Requires-Dist: termcolor==2.5.0; extra == "datahub-reporting-forms"
 Requires-Dist: pydantic<2; extra == "datahub-reporting-forms"
-Requires-Dist: boto3; extra == "datahub-reporting-forms"
-Requires-Dist: duckdb; extra == "datahub-reporting-forms"
-Requires-Dist: pyarrow; extra == "datahub-reporting-forms"
 Provides-Extra: datahub-reporting-extract-graph
+Requires-Dist: pyarrow; extra == "datahub-reporting-extract-graph"
+Requires-Dist: duckdb; extra == "datahub-reporting-extract-graph"
+Requires-Dist: boto3; extra == "datahub-reporting-extract-graph"
 Requires-Dist: opensearch-py==2.4.2; extra == "datahub-reporting-extract-graph"
 Requires-Dist: pandas; extra == "datahub-reporting-extract-graph"
 Requires-Dist: pydantic<2; extra == "datahub-reporting-extract-graph"
-Requires-Dist: boto3; extra == "datahub-reporting-extract-graph"
-Requires-Dist: duckdb; extra == "datahub-reporting-extract-graph"
-Requires-Dist: pyarrow; extra == "datahub-reporting-extract-graph"
 Provides-Extra: datahub-reporting-extract-sql
+Requires-Dist: pyarrow; extra == "datahub-reporting-extract-sql"
+Requires-Dist: duckdb; extra == "datahub-reporting-extract-sql"
+Requires-Dist: boto3; extra == "datahub-reporting-extract-sql"
 Requires-Dist: pandas; extra == "datahub-reporting-extract-sql"
 Requires-Dist: pydantic<2; extra == "datahub-reporting-extract-sql"
-Requires-Dist: boto3; extra == "datahub-reporting-extract-sql"
-Requires-Dist: duckdb; extra == "datahub-reporting-extract-sql"
-Requires-Dist: pyarrow; extra == "datahub-reporting-extract-sql"
 Provides-Extra: datahub-usage-reporting
-Requires-Dist: termcolor==2.5.0; extra == "datahub-usage-reporting"
-Requires-Dist: pandas; extra == "datahub-usage-reporting"
-Requires-Dist: elasticsearch==7.13.4; extra == "datahub-usage-reporting"
+Requires-Dist: pyarrow; extra == "datahub-usage-reporting"
 Requires-Dist: duckdb; extra == "datahub-usage-reporting"
-Requires-Dist: pyarrow<=18.0.0; extra == "datahub-usage-reporting"
+Requires-Dist: numpy<2; extra == "datahub-usage-reporting"
+Requires-Dist: scipy<=1.14.1; extra == "datahub-usage-reporting"
+Requires-Dist: elasticsearch==7.13.4; extra == "datahub-usage-reporting"
+Requires-Dist: pandas; extra == "datahub-usage-reporting"
 Requires-Dist: boto3; extra == "datahub-usage-reporting"
-Requires-Dist: pyarrow; extra == "datahub-usage-reporting"
+Requires-Dist: polars==1.23.0; extra == "datahub-usage-reporting"
 Requires-Dist: opensearch-py==2.4.2; extra == "datahub-usage-reporting"
-Requires-Dist: numpy<2; extra == "datahub-usage-reporting"
+Requires-Dist: pyarrow<=18.0.0; extra == "datahub-usage-reporting"
+Requires-Dist: termcolor==2.5.0; extra == "datahub-usage-reporting"
 Requires-Dist: pydantic<2; extra == "datahub-usage-reporting"
-Requires-Dist: scipy<=1.14.1; extra == "datahub-usage-reporting"
-Requires-Dist: polars==1.19.0; extra == "datahub-usage-reporting"
 Provides-Extra: datahub-metadata-sharing
 Requires-Dist: tenacity; extra == "datahub-metadata-sharing"
 Provides-Extra: acryl-cs-issues
-Requires-Dist: zenpy; extra == "acryl-cs-issues"
-Requires-Dist: jinja2; extra == "acryl-cs-issues"
 Requires-Dist: openai; extra == "acryl-cs-issues"
 Requires-Dist: slack-sdk; extra == "acryl-cs-issues"
+Requires-Dist: jinja2; extra == "acryl-cs-issues"
+Requires-Dist: zenpy; extra == "acryl-cs-issues"
 Provides-Extra: all
-Requires-Dist: tenacity; extra == "all"
-Requires-Dist: termcolor==2.5.0; extra == "all"
-Requires-Dist: jinja2; extra == "all"
-Requires-Dist: elasticsearch==7.13.4; extra == "all"
-Requires-Dist: pyarrow<=18.0.0; extra == "all"
-Requires-Dist: boto3; extra == "all"
+Requires-Dist: pyarrow; extra == "all"
 Requires-Dist: numpy<2; extra == "all"
 Requires-Dist: scipy<=1.14.1; extra == "all"
+Requires-Dist: elasticsearch==7.13.4; extra == "all"
+Requires-Dist: tenacity; extra == "all"
+Requires-Dist: slack-sdk; extra == "all"
 Requires-Dist: zenpy; extra == "all"
+Requires-Dist: boto3; extra == "all"
+Requires-Dist: jinja2; extra == "all"
+Requires-Dist: pydantic<2; extra == "all"
+Requires-Dist: duckdb; extra == "all"
 Requires-Dist: pandas; extra == "all"
 Requires-Dist: openai; extra == "all"
-Requires-Dist: duckdb; extra == "all"
-Requires-Dist: pyarrow; extra == "all"
+Requires-Dist: polars==1.23.0; extra == "all"
 Requires-Dist: opensearch-py==2.4.2; extra == "all"
-Requires-Dist: pydantic<2; extra == "all"
-Requires-Dist: polars==1.19.0; extra == "all"
-Requires-Dist: slack-sdk; extra == "all"
+Requires-Dist: pyarrow<=18.0.0; extra == "all"
+Requires-Dist: termcolor==2.5.0; extra == "all"
 Provides-Extra: dev
+Requires-Dist: pyarrow; extra == "dev"
+Requires-Dist: duckdb; extra == "dev"
+Requires-Dist: numpy<2; extra == "dev"
+Requires-Dist: scipy<=1.14.1; extra == "dev"
+Requires-Dist: elasticsearch==7.13.4; extra == "dev"
 Requires-Dist: tenacity; extra == "dev"
-Requires-Dist: termcolor==2.5.0; extra == "dev"
+Requires-Dist: slack-sdk; extra == "dev"
+Requires-Dist: zenpy; extra == "dev"
 Requires-Dist: pandas; extra == "dev"
-Requires-Dist: jinja2; extra == "dev"
 Requires-Dist: openai; extra == "dev"
-Requires-Dist: elasticsearch==7.13.4; extra == "dev"
-Requires-Dist: zenpy; extra == "dev"
-Requires-Dist: duckdb; extra == "dev"
-Requires-Dist: pyarrow<=18.0.0; extra == "dev"
 Requires-Dist: boto3; extra == "dev"
-Requires-Dist: acryl-datahub[dev]; extra == "dev"
-Requires-Dist: pyarrow; extra == "dev"
+Requires-Dist: polars==1.23.0; extra == "dev"
 Requires-Dist: opensearch-py==2.4.2; extra == "dev"
-Requires-Dist: numpy<2; extra == "dev"
+Requires-Dist: pyarrow<=18.0.0; extra == "dev"
+Requires-Dist: jinja2; extra == "dev"
+Requires-Dist: acryl-datahub[dev]; extra == "dev"
+Requires-Dist: termcolor==2.5.0; extra == "dev"
 Requires-Dist: pydantic<2; extra == "dev"
-Requires-Dist: scipy<=1.14.1; extra == "dev"
-Requires-Dist: polars==1.19.0; extra == "dev"
-Requires-Dist: slack-sdk; extra == "dev"
 Dynamic: provides-extra
 Dynamic: requires-dist

{acryl_datahub_cloud-0.3.8.2rc4.dist-info → acryl_datahub_cloud-0.3.8.2rc5.dist-info}/RECORD RENAMED Viewed

@@ -1,5 +1,5 @@
 acryl_datahub_cloud/__init__.py,sha256=axrMXkn0RW80YmuZgwUP_YQImcv6L28duZLWnW-gaNM,521
-acryl_datahub_cloud/_codegen_config.json,sha256=XRL-98-B46wLKuqWqW9fTNbwj6FLkaF4WAqOqczAe4A,557
+acryl_datahub_cloud/_codegen_config.json,sha256=bYIuxLP1GvkXG4fP20J2YVCVGNOvJ1EEVRFVbP6BgnA,557
 acryl_datahub_cloud/py.typed,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 acryl_datahub_cloud/acryl_cs_issues/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 acryl_datahub_cloud/acryl_cs_issues/acryl_customer.py,sha256=uFjR2SqGS34y09-S9WqOqNGY8nOq6ptGf4y9781i8Z4,25230
@@ -27,16 +27,16 @@ acryl_datahub_cloud/datahub_restore/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQ
 acryl_datahub_cloud/datahub_restore/do_restore.py,sha256=Pjd3qE1lYXltKhpkI1KvO-7fM_ksnisFvmJ8bqGcT8Q,2284
 acryl_datahub_cloud/datahub_restore/source.py,sha256=i4NJ3os4mzAnOHnmR-OaHxVUe4rMeLle2mucCT_-8yA,5339
 acryl_datahub_cloud/datahub_usage_reporting/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-acryl_datahub_cloud/datahub_usage_reporting/query_builder.py,sha256=ft2PRg_YHTYWnZOVznOEx3PSSqAfiaH0YJtkPcS-NJM,5837
+acryl_datahub_cloud/datahub_usage_reporting/query_builder.py,sha256=hBHJRbsPJBeVpbu_QgCrFHQAR0cxAep2fGYkbFPahpc,5892
 acryl_datahub_cloud/datahub_usage_reporting/usage_feature_patch_builder.py,sha256=gR9neaHfi0JMQmAKMlgJCEuZIni7cdPFApGOKa5Pn4Y,14406
-acryl_datahub_cloud/datahub_usage_reporting/usage_feature_reporter.py,sha256=t6dW-sfvjpqAO4Y1cwRl8xkKSZ5B1CmlD-EEhIIZq3g,64277
+acryl_datahub_cloud/datahub_usage_reporting/usage_feature_reporter.py,sha256=qJNrXu6fwPePenSCLMkiRSGyQgROcju54fULVPPq3VA,65875
 acryl_datahub_cloud/elasticsearch/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 acryl_datahub_cloud/elasticsearch/config.py,sha256=6QNBOmoQZu1cJrDIBZyvZgdQt0QLfP82hdQkPtP-4HE,1220
 acryl_datahub_cloud/elasticsearch/graph_service.py,sha256=K4ykcSMxlrhlDrchhte3vEb1mcw8QkOmdIFSVSX4OVU,2788
 acryl_datahub_cloud/lineage_features/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 acryl_datahub_cloud/lineage_features/source.py,sha256=Edve1oBoR87RTloAfjAuxgULlMI_HNSFuQfbiVjkac4,6412
 acryl_datahub_cloud/metadata/__init__.py,sha256=AjhXPjI6cnpdcrBRrE5gOWo15vv2TTl2ctU4UAnUN7A,238
-acryl_datahub_cloud/metadata/schema.avsc,sha256=VZhHa4KP2Rr2W-DTKfombxwD0PM9dum7_Th_F0Za3B0,1002817
+acryl_datahub_cloud/metadata/schema.avsc,sha256=IptmiRUVlqmv1wQRvvzt2xfBOpx8-X1SpZpVt_6RSKY,1003121
 acryl_datahub_cloud/metadata/schema_classes.py,sha256=-lEIbtHuajGDV9tseTy-OVhAFt76U99_-QHibq8DGk8,1388729
 acryl_datahub_cloud/metadata/_urns/__init__.py,sha256=cOF3GHMDgPhmbLKbN02NPpuLGHSu0qNgQyBRv08eqF0,243
 acryl_datahub_cloud/metadata/_urns/urn_defs.py,sha256=UB7a-SusVpQfxgyBiUZ4uaHn8xIhIYOPybOMbhhUSds,125081
@@ -375,7 +375,7 @@ acryl_datahub_cloud/metadata/schemas/SourceCode.avsc,sha256=tUgo2rczO5x1fxw3fYNW
 acryl_datahub_cloud/metadata/schemas/Status.avsc,sha256=rPZSXSJdwnNywqNx2qll8cdt54aYgI-YUbRr3GK7h78,522
 acryl_datahub_cloud/metadata/schemas/StorageFeatures.avsc,sha256=F5LFc4P05YrKReB8ZsxJNXSLg2FJaE7vk63NM4GN0dE,1752
 acryl_datahub_cloud/metadata/schemas/StructuredProperties.avsc,sha256=N0NNDrkqbIgEHrb5uz1ynwZh3mb_ICVK7tDcnBLMfjI,4032
-acryl_datahub_cloud/metadata/schemas/StructuredPropertyDefinition.avsc,sha256=yLmH1SNHL4c7J6aIA5GBrc1rI3aAyWPlT47yYFnZZYk,12295
+acryl_datahub_cloud/metadata/schemas/StructuredPropertyDefinition.avsc,sha256=xxtbACqH6OpJgW1gtP6lswkQnG__J_esH7HKCOdqUNs,12571
 acryl_datahub_cloud/metadata/schemas/StructuredPropertyKey.avsc,sha256=RpAH8fW-64C6yVU8_D1h5vYeg8fNp5t2S6VLpOEcMZM,649
 acryl_datahub_cloud/metadata/schemas/StructuredPropertySettings.avsc,sha256=EDNlXfT1TqogfulCanIc-nuYO9ZxRFOGzD9tl3ZJdB8,3732
 acryl_datahub_cloud/metadata/schemas/SubTypes.avsc,sha256=bhXbzK020zDyQno97Xp05vmoMeZ82IGu2jz7pWDo3RQ,655
@@ -398,8 +398,8 @@ acryl_datahub_cloud/metadata/schemas/VersionSetKey.avsc,sha256=psjGNNcFua3Zs9Xlh
 acryl_datahub_cloud/metadata/schemas/VersionSetProperties.avsc,sha256=yrhhVNioD11nFlDO7IfUbxAQjhA9Tr-4wnAYH5I9W74,1172
 acryl_datahub_cloud/metadata/schemas/ViewProperties.avsc,sha256=3HhcbH5493dJUnEUtFMYMVfbYQ52aDedm5L4j77Nym4,1032
 acryl_datahub_cloud/metadata/schemas/__init__.py,sha256=uvLNC3VyCkWA_v8e9FdA1leFf46NFKDD0AajCfihepI,581
-acryl_datahub_cloud-0.3.8.2rc4.dist-info/METADATA,sha256=3rzD51KpcP4vW9YooklUMG6dszc5Y8lTQ0Mf5PaeS8I,4432
-acryl_datahub_cloud-0.3.8.2rc4.dist-info/WHEEL,sha256=nn6H5-ilmfVryoAQl3ZQ2l8SH5imPWFpm1A5FgEuFV4,91
-acryl_datahub_cloud-0.3.8.2rc4.dist-info/entry_points.txt,sha256=HpypFu4cwe0kT3zXFcqbOG-QTNjzYaV6NiCX0Pgy9LI,1086
-acryl_datahub_cloud-0.3.8.2rc4.dist-info/top_level.txt,sha256=EwgCxfX-DzJANwxj-Mx_j4TOfAFhmc_FgMbRPzWsoZs,20
-acryl_datahub_cloud-0.3.8.2rc4.dist-info/RECORD,,
+acryl_datahub_cloud-0.3.8.2rc5.dist-info/METADATA,sha256=xBnAcZP3jeFENrzm2fvLnm35Fc7Y6Nsrj3hVc5Tq7Wo,4432
+acryl_datahub_cloud-0.3.8.2rc5.dist-info/WHEEL,sha256=jB7zZ3N9hIM9adW7qlTAyycLYW9npaWKLRzaoVcLKcM,91
+acryl_datahub_cloud-0.3.8.2rc5.dist-info/entry_points.txt,sha256=HpypFu4cwe0kT3zXFcqbOG-QTNjzYaV6NiCX0Pgy9LI,1086
+acryl_datahub_cloud-0.3.8.2rc5.dist-info/top_level.txt,sha256=EwgCxfX-DzJANwxj-Mx_j4TOfAFhmc_FgMbRPzWsoZs,20
+acryl_datahub_cloud-0.3.8.2rc5.dist-info/RECORD,,

{acryl_datahub_cloud-0.3.8.2rc4.dist-info → acryl_datahub_cloud-0.3.8.2rc5.dist-info}/WHEEL RENAMED Viewed

@@ -1,5 +1,5 @@
 Wheel-Version: 1.0
-Generator: setuptools (75.8.1)
+Generator: setuptools (75.8.2)
 Root-Is-Purelib: true
 Tag: py3-none-any

{acryl_datahub_cloud-0.3.8.2rc4.dist-info → acryl_datahub_cloud-0.3.8.2rc5.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{acryl_datahub_cloud-0.3.8.2rc4.dist-info → acryl_datahub_cloud-0.3.8.2rc5.dist-info}/top_level.txt RENAMED Viewed

File without changes

acryl-datahub-cloud 0.3.8.2rc4__py3-none-any.whl → 0.3.8.2rc5__py3-none-any.whl

Potentially problematic release.

acryl-datahub-cloud 0.3.8.2rc4py3-none-any.whl → 0.3.8.2rc5py3-none-any.whl