PyPI - acryl-datahub - Versions diffs - 1.3.0.1rc5__py3-none-any.whl → 1.3.0.1rc7__py3-none-any.whl - Mend

acryl-datahub 1.3.0.1rc5py3-none-any.whl → 1.3.0.1rc7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of acryl-datahub might be problematic. Click here for more details.

Files changed (47) hide show

datahub/ingestion/source/common/subtypes.py CHANGED Viewed

@@ -34,6 +34,8 @@ class DatasetSubTypes(StrEnum):
     API_ENDPOINT = "API Endpoint"
     SLACK_CHANNEL = "Slack Channel"
     PROJECTIONS = "Projections"
+    GOOGLE_SHEETS = "Google Sheets"
+    GOOGLE_SHEETS_NAMED_RANGE = "Google Sheets Named Range"
     # TODO: Create separate entity...
     NOTEBOOK = "Notebook"

datahub/ingestion/source/dremio/dremio_source.py CHANGED Viewed

@@ -338,10 +338,10 @@ class DremioSource(StatefulIngestionSourceBase):
             return
         dataset_urn = make_dataset_urn_with_platform_instance(
-            platform=make_data_platform_urn(self.get_platform()),
-            name=f"dremio.{dataset_name}",
-            env=self.config.env,
+            platform=self.get_platform(),
+            name=dataset_name,
             platform_instance=self.config.platform_instance,
+            env=self.config.env,
         )
         for dremio_mcp in self.dremio_aspects.populate_dataset_mcp(
@@ -421,10 +421,10 @@ class DremioSource(StatefulIngestionSourceBase):
         schema_str = ".".join(dataset_info.path)
         dataset_name = f"{schema_str}.{dataset_info.resource_name}".lower()
         dataset_urn = make_dataset_urn_with_platform_instance(
-            platform=make_data_platform_urn(self.get_platform()),
-            name=f"dremio.{dataset_name}",
-            env=self.config.env,
+            platform=self.get_platform(),
+            name=dataset_name,
             platform_instance=self.config.platform_instance,
+            env=self.config.env,
         )
         yield from self.profiler.get_workunits(dataset_info, dataset_urn)
@@ -436,10 +436,10 @@ class DremioSource(StatefulIngestionSourceBase):
         """
         upstream_urns = [
             make_dataset_urn_with_platform_instance(
-                platform=make_data_platform_urn(self.get_platform()),
-                name=f"dremio.{upstream_table.lower()}",
-                env=self.config.env,
+                platform=self.get_platform(),
+                name=upstream_table.lower(),
                 platform_instance=self.config.platform_instance,
+                env=self.config.env,
             )
             for upstream_table in parents
         ]
@@ -498,19 +498,19 @@ class DremioSource(StatefulIngestionSourceBase):
         if query.query and query.affected_dataset:
             upstream_urns = [
                 make_dataset_urn_with_platform_instance(
-                    platform=make_data_platform_urn(self.get_platform()),
-                    name=f"dremio.{ds.lower()}",
-                    env=self.config.env,
+                    platform=self.get_platform(),
+                    name=ds.lower(),
                     platform_instance=self.config.platform_instance,
+                    env=self.config.env,
                 )
                 for ds in query.queried_datasets
             ]
             downstream_urn = make_dataset_urn_with_platform_instance(
-                platform=make_data_platform_urn(self.get_platform()),
-                name=f"dremio.{query.affected_dataset.lower()}",
-                env=self.config.env,
+                platform=self.get_platform(),
+                name=query.affected_dataset.lower(),
                 platform_instance=self.config.platform_instance,
+                env=self.config.env,
             )
             # Add query to SqlParsingAggregator

datahub/ingestion/source/dynamodb/dynamodb.py CHANGED Viewed

@@ -163,7 +163,7 @@ _attribute_type_to_field_type_mapping: Dict[str, Type] = {
 @platform_name("DynamoDB", id="dynamodb")
 @config_class(DynamoDBConfig)
-@support_status(SupportStatus.TESTING)
+@support_status(SupportStatus.INCUBATING)
 @capability(
     SourceCapability.PLATFORM_INSTANCE,
     "By default, platform_instance will use the AWS account id",

datahub/ingestion/source/fivetran/config.py CHANGED Viewed

@@ -68,14 +68,22 @@ class Constant:
     SUCCESSFUL = "SUCCESSFUL"
     FAILURE_WITH_TASK = "FAILURE_WITH_TASK"
     CANCELED = "CANCELED"
+    GOOGLE_SHEETS_CONNECTOR_TYPE = "google_sheets"
+# Key: Connector Type, Value: Platform ID/Name
 KNOWN_DATA_PLATFORM_MAPPING = {
     "google_cloud_postgresql": "postgres",
     "postgres": "postgres",
     "snowflake": "snowflake",
+    Constant.GOOGLE_SHEETS_CONNECTOR_TYPE: Constant.GOOGLE_SHEETS_CONNECTOR_TYPE,
 }
+# Note: (As of Oct 2025) Fivetran Platform Connector has stale lineage metadata for Google Sheets column data (deleted/renamed).
+# Ref: https://fivetran.com/docs/connectors/files/google-sheets#deletingdata
+# TODO: Remove Google Sheets connector type from DISABLE_LINEAGE_FOR_CONNECTOR_TYPES
+DISABLE_COL_LINEAGE_FOR_CONNECTOR_TYPES = [Constant.GOOGLE_SHEETS_CONNECTOR_TYPE]
 class SnowflakeDestinationConfig(SnowflakeConnectionConfig):
     database: str = Field(description="The fivetran connector log database.")
@@ -97,6 +105,17 @@ class DatabricksDestinationConfig(UnityCatalogConnectionConfig):
         return warehouse_id
+class FivetranAPIConfig(ConfigModel):
+    api_key: str = Field(description="Fivetran API key")
+    api_secret: str = Field(description="Fivetran API secret")
+    base_url: str = Field(
+        default="https://api.fivetran.com", description="Fivetran API base URL"
+    )
+    request_timeout_sec: int = Field(
+        default=30, description="Request timeout in seconds"
+    )
 class FivetranLogConfig(ConfigModel):
     destination_platform: Literal["snowflake", "bigquery", "databricks"] = (
         pydantic.Field(
@@ -163,6 +182,7 @@ class MetadataExtractionPerfReport(Report):
 @dataclasses.dataclass
 class FivetranSourceReport(StaleEntityRemovalSourceReport):
     connectors_scanned: int = 0
+    fivetran_rest_api_call_count: int = 0
     filtered_connectors: LossyList[str] = dataclasses.field(default_factory=LossyList)
     metadata_extraction_perf: MetadataExtractionPerfReport = dataclasses.field(
         default_factory=MetadataExtractionPerfReport
@@ -174,6 +194,9 @@ class FivetranSourceReport(StaleEntityRemovalSourceReport):
     def report_connectors_dropped(self, connector: str) -> None:
         self.filtered_connectors.append(connector)
+    def report_fivetran_rest_api_call_count(self) -> None:
+        self.fivetran_rest_api_call_count += 1
 class PlatformDetail(ConfigModel):
     platform: Optional[str] = pydantic.Field(
@@ -234,6 +257,16 @@ class FivetranSourceConfig(StatefulIngestionConfigBase, DatasetSourceConfigMixin
         description="A mapping of destination id to its platform/instance/env details.",
     )
+    """
+    Use Fivetran REST API to get :
+    - Google Sheets Connector details and emit related entities
+    Fivetran Platform Connector syncs limited information about the Google Sheets Connector.
+    """
+    api_config: Optional[FivetranAPIConfig] = Field(
+        default=None,
+        description="Fivetran REST API configuration, used to provide wider support for connections.",
+    )
     @pydantic.root_validator(pre=True)
     def compat_sources_to_database(cls, values: Dict) -> Dict:
         if "sources_to_database" in values:

datahub/ingestion/source/fivetran/fivetran.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import logging
 from typing import Dict, Iterable, List, Optional, Union
+from urllib.parse import urlparse
 import datahub.emitter.mce_builder as builder
 from datahub.api.entities.datajob import DataJob as DataJobV1
@@ -22,6 +23,7 @@ from datahub.ingestion.api.source import (
     StructuredLogCategory,
 )
 from datahub.ingestion.api.workunit import MetadataWorkUnit
+from datahub.ingestion.source.common.subtypes import DatasetSubTypes
 from datahub.ingestion.source.fivetran.config import (
     KNOWN_DATA_PLATFORM_MAPPING,
     Constant,
@@ -35,29 +37,39 @@ from datahub.ingestion.source.fivetran.fivetran_query import (
     MAX_JOBS_PER_CONNECTOR,
     MAX_TABLE_LINEAGE_PER_CONNECTOR,
 )
+from datahub.ingestion.source.fivetran.fivetran_rest_api import FivetranAPIClient
+from datahub.ingestion.source.fivetran.response_models import FivetranConnectionDetails
 from datahub.ingestion.source.state.stale_entity_removal_handler import (
     StaleEntityRemovalHandler,
 )
 from datahub.ingestion.source.state.stateful_ingestion_base import (
     StatefulIngestionSourceBase,
 )
+from datahub.metadata.com.linkedin.pegasus2avro.common import AuditStamp
 from datahub.metadata.com.linkedin.pegasus2avro.dataset import (
     FineGrainedLineage,
     FineGrainedLineageDownstreamType,
     FineGrainedLineageUpstreamType,
+    UpstreamLineage,
+)
+from datahub.metadata.schema_classes import (
+    DatasetLineageTypeClass,
+    UpstreamClass,
 )
 from datahub.metadata.urns import CorpUserUrn, DataFlowUrn, DatasetUrn
 from datahub.sdk.dataflow import DataFlow
 from datahub.sdk.datajob import DataJob
+from datahub.sdk.dataset import Dataset
 from datahub.sdk.entity import Entity
 # Logger instance
 logger = logging.getLogger(__name__)
+CORPUSER_DATAHUB = "urn:li:corpuser:datahub"
 @platform_name("Fivetran")
 @config_class(FivetranSourceConfig)
-@support_status(SupportStatus.INCUBATING)
+@support_status(SupportStatus.CERTIFIED)
 @capability(SourceCapability.PLATFORM_INSTANCE, "Enabled by default")
 @capability(
     SourceCapability.LINEAGE_FINE,
@@ -76,8 +88,12 @@ class FivetranSource(StatefulIngestionSourceBase):
         super().__init__(config, ctx)
         self.config = config
         self.report = FivetranSourceReport()
         self.audit_log = FivetranLogAPI(self.config.fivetran_log_config)
+        self.api_client: Optional[FivetranAPIClient] = None
+        self._connection_details_cache: Dict[str, FivetranConnectionDetails] = {}
+        if self.config.api_config:
+            self.api_client = FivetranAPIClient(self.config.api_config)
     def _extend_lineage(self, connector: Connector, datajob: DataJob) -> Dict[str, str]:
         input_dataset_urn_list: List[Union[str, DatasetUrn]] = []
@@ -131,17 +147,43 @@ class FivetranSource(StatefulIngestionSourceBase):
                 if source_details.include_schema_in_urn
                 else lineage.source_table.split(".", 1)[1]
             )
-            input_dataset_urn = DatasetUrn.create_from_ids(
-                platform_id=source_details.platform,
-                table_name=(
-                    f"{source_details.database.lower()}.{source_table}"
-                    if source_details.database
-                    else source_table
-                ),
-                env=source_details.env,
-                platform_instance=source_details.platform_instance,
-            )
-            input_dataset_urn_list.append(input_dataset_urn)
+            input_dataset_urn: Optional[DatasetUrn] = None
+            # Special Handling for Google Sheets Connectors
+            if connector.connector_type == Constant.GOOGLE_SHEETS_CONNECTOR_TYPE:
+                # Get Google Sheet dataset details from Fivetran API
+                # This is cached in the api_client
+                gsheets_conn_details: Optional[FivetranConnectionDetails] = (
+                    self._get_connection_details_by_id(connector.connector_id)
+                )
+                if gsheets_conn_details:
+                    input_dataset_urn = DatasetUrn.create_from_ids(
+                        platform_id=Constant.GOOGLE_SHEETS_CONNECTOR_TYPE,
+                        table_name=self._get_gsheet_named_range_dataset_id(
+                            gsheets_conn_details
+                        ),
+                        env=source_details.env,
+                    )
+                else:
+                    self.report.warning(
+                        title="Failed to extract lineage for Google Sheets Connector",
+                        message="Unable to extract lineage for Google Sheets Connector, as the connector details are not available from Fivetran API.",
+                        context=f"{connector.connector_name} (connector_id: {connector.connector_id})",
+                    )
+            else:
+                input_dataset_urn = DatasetUrn.create_from_ids(
+                    platform_id=source_details.platform,
+                    table_name=(
+                        f"{source_details.database.lower()}.{source_table}"
+                        if source_details.database
+                        else source_table
+                    ),
+                    env=source_details.env,
+                    platform_instance=source_details.platform_instance,
+                )
+            if input_dataset_urn:
+                input_dataset_urn_list.append(input_dataset_urn)
             destination_table = (
                 lineage.destination_table
@@ -262,6 +304,67 @@ class FivetranSource(StatefulIngestionSourceBase):
             clone_outlets=True,
         )
+    def _get_connection_details_by_id(
+        self, connection_id: str
+    ) -> Optional[FivetranConnectionDetails]:
+        if self.api_client is None:
+            self.report.warning(
+                title="Fivetran API client is not initialized",
+                message="Google Sheets Connector details cannot be extracted, as Fivetran API client is not initialized.",
+                context=f"connector_id: {connection_id}",
+            )
+            return None
+        if connection_id in self._connection_details_cache:
+            return self._connection_details_cache[connection_id]
+        try:
+            self.report.report_fivetran_rest_api_call_count()
+            conn_details = self.api_client.get_connection_details_by_id(connection_id)
+            # Update Cache
+            if conn_details:
+                self._connection_details_cache[connection_id] = conn_details
+            return conn_details
+        except Exception as e:
+            self.report.warning(
+                title="Failed to get connection details for Google Sheets Connector",
+                message=f"Exception occurred while getting connection details from Fivetran API. {e}",
+                context=f"connector_id: {connection_id}",
+            )
+            return None
+    def _get_gsheet_sheet_id_from_url(
+        self, gsheets_conn_details: FivetranConnectionDetails
+    ) -> str:
+        # Extracting the sheet_id (1A82PdLAE7NXLLb5JcLPKeIpKUMytXQba5Z-Ei-mbXLo) from the sheet_id url
+        # "https://docs.google.com/spreadsheets/d/1A82PdLAE7NXLLb5JcLPKeIpKUMytXQba5Z-Ei-mbXLo/edit?gid=0#gid=0",
+        try:
+            parsed = urlparse(gsheets_conn_details.config.sheet_id)
+            # Example: https://docs.google.com/spreadsheets/d/<spreadsheetId>/edit
+            parts = parsed.path.split("/")
+            return parts[3] if len(parts) > 2 else ""
+        except Exception as e:
+            logger.warning(
+                f"Failed to extract sheet_id from the sheet_id url: {gsheets_conn_details.config.sheet_id}, {e}"
+            )
+        return ""
+    def _get_gsheet_named_range_dataset_id(
+        self, gsheets_conn_details: FivetranConnectionDetails
+    ) -> str:
+        sheet_id = self._get_gsheet_sheet_id_from_url(gsheets_conn_details)
+        named_range_id = (
+            f"{sheet_id}.{gsheets_conn_details.config.named_range}"
+            if sheet_id
+            else gsheets_conn_details.config.named_range
+        )
+        logger.debug(
+            f"Using gsheet_named_range_dataset_id: {named_range_id} for connector: {gsheets_conn_details.id}"
+        )
+        return named_range_id
     def _get_dpi_workunits(
         self, job: Job, dpi: DataProcessInstance
     ) -> Iterable[MetadataWorkUnit]:
@@ -295,6 +398,74 @@ class FivetranSource(StatefulIngestionSourceBase):
         self, connector: Connector
     ) -> Iterable[Union[MetadataWorkUnit, Entity]]:
         self.report.report_connectors_scanned()
+        """
+        -------------------------------------------------------
+        Special Handling for Google Sheets Connectors
+        -------------------------------------------------------
+        Google Sheets source is not supported by Datahub yet.
+        As a workaround, we are emitting a dataset entity for the Google Sheet
+        and adding it to the lineage. This workaround needs to be removed once
+        Datahub supports Google Sheets source natively.
+        -------------------------------------------------------
+        """
+        if connector.connector_type == Constant.GOOGLE_SHEETS_CONNECTOR_TYPE:
+            # Get Google Sheet dataset details from Fivetran API
+            gsheets_conn_details: Optional[FivetranConnectionDetails] = (
+                self._get_connection_details_by_id(connector.connector_id)
+            )
+            if gsheets_conn_details:
+                gsheets_dataset = Dataset(
+                    name=self._get_gsheet_sheet_id_from_url(gsheets_conn_details),
+                    platform=Constant.GOOGLE_SHEETS_CONNECTOR_TYPE,
+                    env=self.config.env,
+                    display_name=self._get_gsheet_sheet_id_from_url(
+                        gsheets_conn_details
+                    ),
+                    external_url=gsheets_conn_details.config.sheet_id,
+                    created=gsheets_conn_details.created_at,
+                    last_modified=gsheets_conn_details.source_sync_details.last_synced,
+                    subtype=DatasetSubTypes.GOOGLE_SHEETS,
+                    custom_properties={
+                        "ingested_by": "fivetran source",
+                        "connector_id": gsheets_conn_details.id,
+                    },
+                )
+                gsheets_named_range_dataset = Dataset(
+                    name=self._get_gsheet_named_range_dataset_id(gsheets_conn_details),
+                    platform=Constant.GOOGLE_SHEETS_CONNECTOR_TYPE,
+                    env=self.config.env,
+                    display_name=gsheets_conn_details.config.named_range,
+                    external_url=gsheets_conn_details.config.sheet_id,
+                    created=gsheets_conn_details.created_at,
+                    last_modified=gsheets_conn_details.source_sync_details.last_synced,
+                    subtype=DatasetSubTypes.GOOGLE_SHEETS_NAMED_RANGE,
+                    custom_properties={
+                        "ingested_by": "fivetran source",
+                        "connector_id": gsheets_conn_details.id,
+                    },
+                    upstreams=UpstreamLineage(
+                        upstreams=[
+                            UpstreamClass(
+                                dataset=str(gsheets_dataset.urn),
+                                type=DatasetLineageTypeClass.VIEW,
+                                auditStamp=AuditStamp(
+                                    time=int(
+                                        gsheets_conn_details.created_at.timestamp()
+                                        * 1000
+                                    ),
+                                    actor=CORPUSER_DATAHUB,
+                                ),
+                            )
+                        ],
+                        fineGrainedLineages=None,
+                    ),
+                )
+                yield gsheets_dataset
+                yield gsheets_named_range_dataset
         # Create dataflow entity with same name as connector name
         dataflow = self._generate_dataflow_from_connector(connector)
         yield dataflow

datahub/ingestion/source/fivetran/fivetran_log_api.py CHANGED Viewed

@@ -9,6 +9,7 @@ from sqlalchemy import create_engine
 from datahub.configuration.common import AllowDenyPattern, ConfigurationError
 from datahub.ingestion.source.fivetran.config import (
+    DISABLE_COL_LINEAGE_FOR_CONNECTOR_TYPES,
     Constant,
     FivetranLogConfig,
     FivetranSourceReport,
@@ -112,7 +113,11 @@ class FivetranLogAPI:
         """
         Returns dict of column lineage metadata with key as (<SOURCE_TABLE_ID>, <DESTINATION_TABLE_ID>)
         """
-        all_column_lineage = defaultdict(list)
+        all_column_lineage: Dict[Tuple[str, str], List] = defaultdict(list)
+        if not connector_ids:
+            return dict(all_column_lineage)
         column_lineage_result = self._query(
             self.fivetran_log_query.get_column_lineage_query(
                 connector_ids=connector_ids
@@ -130,7 +135,11 @@ class FivetranLogAPI:
         """
         Returns dict of table lineage metadata with key as 'CONNECTOR_ID'
         """
-        connectors_table_lineage_metadata = defaultdict(list)
+        connectors_table_lineage_metadata: Dict[str, List] = defaultdict(list)
+        if not connector_ids:
+            return dict(connectors_table_lineage_metadata)
         table_lineage_result = self._query(
             self.fivetran_log_query.get_table_lineage_query(connector_ids=connector_ids)
         )
@@ -246,9 +255,15 @@ class FivetranLogAPI:
         return self._get_users().get(user_id)
     def _fill_connectors_lineage(self, connectors: List[Connector]) -> None:
-        connector_ids = [connector.connector_id for connector in connectors]
-        table_lineage_metadata = self._get_table_lineage_metadata(connector_ids)
-        column_lineage_metadata = self._get_column_lineage_metadata(connector_ids)
+        # Create 2 filtered connector_ids lists - one for table lineage and one for column lineage
+        tll_connector_ids: List[str] = []
+        cll_connector_ids: List[str] = []
+        for connector in connectors:
+            tll_connector_ids.append(connector.connector_id)
+            if connector.connector_type not in DISABLE_COL_LINEAGE_FOR_CONNECTOR_TYPES:
+                cll_connector_ids.append(connector.connector_id)
+        table_lineage_metadata = self._get_table_lineage_metadata(tll_connector_ids)
+        column_lineage_metadata = self._get_column_lineage_metadata(cll_connector_ids)
         for connector in connectors:
             connector.lineage = self._extract_connector_lineage(
                 table_lineage_result=table_lineage_metadata.get(connector.connector_id),

datahub/ingestion/source/fivetran/fivetran_rest_api.py ADDED Viewed

@@ -0,0 +1,65 @@
+import logging
+import requests
+from requests.adapters import HTTPAdapter
+from urllib3.util import Retry
+from datahub.ingestion.source.fivetran.config import (
+    FivetranAPIConfig,
+)
+from datahub.ingestion.source.fivetran.response_models import FivetranConnectionDetails
+logger = logging.getLogger(__name__)
+# Retry configuration constants
+RETRY_MAX_TIMES = 3
+RETRY_STATUS_CODES = [429, 500, 502, 503, 504]
+RETRY_BACKOFF_FACTOR = 1
+RETRY_ALLOWED_METHODS = ["GET"]
+class FivetranAPIClient:
+    """Client for interacting with the Fivetran REST API."""
+    def __init__(self, config: FivetranAPIConfig) -> None:
+        self.config = config
+        self._session = self._create_session()
+    def _create_session(self) -> requests.Session:
+        """
+        Create a session with retry logic and basic authentication
+        """
+        requests_session = requests.Session()
+        # Configure retry strategy for transient failures
+        retry_strategy = Retry(
+            total=RETRY_MAX_TIMES,
+            backoff_factor=RETRY_BACKOFF_FACTOR,
+            status_forcelist=RETRY_STATUS_CODES,
+            allowed_methods=RETRY_ALLOWED_METHODS,
+            raise_on_status=True,
+        )
+        adapter = HTTPAdapter(max_retries=retry_strategy)
+        requests_session.mount("http://", adapter)
+        requests_session.mount("https://", adapter)
+        # Set up basic authentication
+        requests_session.auth = (self.config.api_key, self.config.api_secret)
+        requests_session.headers.update(
+            {
+                "Content-Type": "application/json",
+                "Accept": "application/json",
+            }
+        )
+        return requests_session
+    def get_connection_details_by_id(
+        self, connection_id: str
+    ) -> FivetranConnectionDetails:
+        """Get details for a specific connection."""
+        connection_details = self._session.get(
+            f"{self.config.base_url}/v1/connections/{connection_id}",
+            timeout=self.config.request_timeout_sec,
+        )
+        return FivetranConnectionDetails(**connection_details.json().get("data", {}))

datahub/ingestion/source/fivetran/response_models.py ADDED Viewed

@@ -0,0 +1,97 @@
+import datetime
+from typing import Dict, List
+from pydantic import BaseModel
+class FivetranConnectionWarnings(BaseModel):
+    code: str  # Warning Code
+    message: str  # Warning Message
+    details: Dict  # Warning Details
+class FivetranConnectionStatus(BaseModel):
+    setup_state: str  # Setup State
+    schema_status: str  # Schema Status
+    sync_state: str  # Sync State
+    update_state: str  # Update State
+    is_historical_sync: bool  # Is Historical Sync
+    warnings: List[FivetranConnectionWarnings]  # Warnings
+class FivetranConnectionConfig(BaseModel):
+    # Note: Connection Config is different for different connectors
+    auth_type: str  # Auth Type
+    sheet_id: str  # Sheet ID - URL to the Google Sheet
+    named_range: str  # Named Range
+class FivetranConnectionSourceSyncDetails(BaseModel):
+    last_synced: datetime.datetime  # Last Synced
+class FivetranConnectionDetails(BaseModel):
+    """
+    Note: This reponse class only captures fields that are relevant to the Google Sheets Connector
+    """
+    id: str  # Source ID
+    group_id: str  # Destination ID
+    service: str  # Connector Type
+    created_at: datetime.datetime
+    succeeded_at: datetime.datetime
+    paused: bool  # Paused Status
+    sync_frequency: int  # Sync Frequency (minutes)
+    status: FivetranConnectionStatus  # Status
+    config: FivetranConnectionConfig  # Connection Config
+    source_sync_details: FivetranConnectionSourceSyncDetails  # Source Sync Details
+    """
+    # Sample Response for Google Sheets Connector
+    {
+        "code": "Success",
+        "data": {
+            "id": "dialectical_remindful",
+            "group_id": "empties_classification",
+            "service": "google_sheets",
+            "service_version": 1,
+            "schema": "fivetran_google_sheets.fivetran_google_sheets",
+            "connected_by": "sewn_restrained",
+            "created_at": "2025-10-06T17:53:01.554289Z",
+            "succeeded_at": "2025-10-06T22:55:45.275000Z",
+            "failed_at": null,
+            "paused": true,
+            "pause_after_trial": false,
+            "sync_frequency": 360,
+            "data_delay_threshold": 0,
+            "data_delay_sensitivity": "NORMAL",
+            "private_link_id": null,
+            "networking_method": "Directly",
+            "proxy_agent_id": null,
+            "schedule_type": "auto",
+            "status": {
+                "setup_state": "connected",
+                "schema_status": "ready",
+                "sync_state": "paused",
+                "update_state": "on_schedule",
+                "is_historical_sync": false,
+                "tasks": [],
+                "warnings": [
+                    {
+                        "code": "snowflake_discontinuing_password_auth",
+                        "message": "Snowflake is discontinuing username/password authentication",
+                        "details": {}
+                    }
+                ]
+            },
+            "config": {
+                "auth_type": "ServiceAccount",
+                "sheet_id": "https://docs.google.com/spreadsheets/d/1A82PdLAE7NXLLb5JcLPKeIpKUMytXQba5Z-Ei-mbXLo/edit?gid=0#gid=0",
+                "named_range": "Fivetran_Test_Range"
+            },
+            "source_sync_details": {
+                "last_synced": "2025-10-06T22:55:27.371Z"
+            }
+        }
+    }
+    """

datahub/ingestion/source/hex/hex.py CHANGED Viewed

@@ -178,7 +178,7 @@ class HexReport(
 @platform_name("Hex")
 @config_class(HexSourceConfig)
-@support_status(SupportStatus.TESTING)
+@support_status(SupportStatus.INCUBATING)
 @capability(SourceCapability.DESCRIPTIONS, "Supported by default")
 @capability(SourceCapability.OWNERSHIP, "Supported by default")
 @capability(SourceCapability.PLATFORM_INSTANCE, "Enabled by default")

datahub/ingestion/source/iceberg/iceberg.py CHANGED Viewed

@@ -118,7 +118,7 @@ logging.getLogger("azure.core.pipeline.policies.http_logging_policy").setLevel(
 @platform_name("Iceberg")
-@support_status(SupportStatus.TESTING)
+@support_status(SupportStatus.INCUBATING)
 @config_class(IcebergSourceConfig)
 @capability(
     SourceCapability.PLATFORM_INSTANCE,

acryl-datahub 1.3.0.1rc5__py3-none-any.whl → 1.3.0.1rc7__py3-none-any.whl

Potentially problematic release.

acryl-datahub 1.3.0.1rc5py3-none-any.whl → 1.3.0.1rc7py3-none-any.whl