PyPI - awslabs.redshift-mcp-server - Versions diffs - 0.0.7__tar.gz → 0.0.8__tar.gz - Mend

awslabs.redshift-mcp-server 0.0.7tar.gz → 0.0.8tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (24) hide show

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: awslabs.redshift-mcp-server
-Version: 0.0.7
+Version: 0.0.8
 Summary: An AWS Labs Model Context Protocol (MCP) server for Redshift
 Project-URL: homepage, https://awslabs.github.io/mcp/
 Project-URL: docs, https://awslabs.github.io/mcp/servers/redshift-mcp-server/
@@ -449,7 +449,6 @@ Your AWS credentials need the following IAM permissions:
         "redshift-serverless:ListWorkgroups",
         "redshift-serverless:GetWorkgroup",
         "redshift-data:ExecuteStatement",
-        "redshift-data:BatchExecuteStatement",
         "redshift-data:DescribeStatement",
         "redshift-data:GetStatementResult"
       ],

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/README.md RENAMED Viewed

@@ -418,7 +418,6 @@ Your AWS credentials need the following IAM permissions:
         "redshift-serverless:ListWorkgroups",
         "redshift-serverless:GetWorkgroup",
         "redshift-data:ExecuteStatement",
-        "redshift-data:BatchExecuteStatement",
         "redshift-data:DescribeStatement",
         "redshift-data:GetStatementResult"
       ],

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/awslabs/redshift_mcp_server/__init__.py RENAMED Viewed

@@ -14,4 +14,4 @@
 """awslabs.redshift-mcp-server"""
-__version__ = '0.0.7'
+__version__ = '0.0.8'

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/awslabs/redshift_mcp_server/consts.py RENAMED Viewed

@@ -21,7 +21,8 @@ CLIENT_RETRIES = {'max_attempts': 5, 'mode': 'adaptive'}
 CLIENT_USER_AGENT_NAME = 'awslabs/mcp/redshift-mcp-server'
 DEFAULT_LOG_LEVEL = 'WARNING'
 QUERY_TIMEOUT = 3600
-QUERY_POLL_INTERVAL = 2
+QUERY_POLL_INTERVAL = 1
+SESSION_KEEPALIVE = 600
 # Best practices
@@ -85,7 +86,7 @@ SELECT
     source_database,
     schema_option
 FROM pg_catalog.svv_all_schemas
-WHERE database_name = {}
+WHERE database_name = :database_name
 ORDER BY schema_name;
 """
@@ -98,7 +99,7 @@ SELECT
     table_type,
     remarks
 FROM pg_catalog.svv_all_tables
-WHERE database_name = {} AND schema_name = {}
+WHERE database_name = :database_name AND schema_name = :schema_name
 ORDER BY table_name;
 """
@@ -117,7 +118,7 @@ SELECT
     numeric_scale,
     remarks
 FROM pg_catalog.svv_all_columns
-WHERE database_name = {} AND schema_name = {} AND table_name = {}
+WHERE database_name = :database_name AND schema_name = :schema_name AND table_name = :table_name
 ORDER BY ordinal_position;
 """

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/awslabs/redshift_mcp_server/redshift.py RENAMED Viewed

@@ -18,6 +18,7 @@ import asyncio
 import boto3
 import os
 import regex
+import time
 from awslabs.redshift_mcp_server import __version__
 from awslabs.redshift_mcp_server.consts import (
     CLIENT_CONNECT_TIMEOUT,
@@ -26,6 +27,7 @@ from awslabs.redshift_mcp_server.consts import (
     CLIENT_USER_AGENT_NAME,
     QUERY_POLL_INTERVAL,
     QUERY_TIMEOUT,
+    SESSION_KEEPALIVE,
     SUSPICIOUS_QUERY_REGEXP,
     SVV_ALL_COLUMNS_QUERY,
     SVV_ALL_SCHEMAS_QUERY,
@@ -101,61 +103,124 @@ class RedshiftClientManager:
         return self._redshift_data_client
-def quote_literal_string(value: str | None) -> str:
-    """Quote a string value as a SQL literal.
+class RedshiftSessionManager:
+    """Manages Redshift Data API sessions for connection reuse."""
+    def __init__(self, session_keepalive: int, app_name: str):
+        """Initialize the session manager.
+        Args:
+            session_keepalive: Session keepalive timeout in seconds.
+            app_name: Application name to set in sessions.
+        """
+        self._sessions = {}  # {cluster:database -> session_info}
+        self._session_keepalive = session_keepalive
+        self._app_name = app_name
+    async def session(
+        self, cluster_identifier: str, database_name: str, cluster_info: dict
+    ) -> str:
+        """Get or create a session for the given cluster and database.
+        Args:
+            cluster_identifier: The cluster identifier to get session for.
+            database_name: The database name to get session for.
+            cluster_info: Cluster information dictionary from discover_clusters.
+        Returns:
+            Session ID for use in ExecuteStatement calls.
+        """
+        # Check existing session
+        session_key = f'{cluster_identifier}:{database_name}'
+        if session_key in self._sessions:
+            session_info = self._sessions[session_key]
+            if not self._is_session_expired(session_info):
+                logger.debug(f'Reusing existing session: {session_info["session_id"]}')
+                return session_info['session_id']
+            else:
+                logger.debug(f'Session expired, removing: {session_info["session_id"]}')
+                del self._sessions[session_key]
+        # Create new session with application name
+        session_id = await self._create_session_with_app_name(
+            cluster_identifier, database_name, cluster_info
+        )
-    Args:
-        value: The string value to quote.
-    """
-    if value is None:
-        return 'NULL'
+        # Store session
+        self._sessions[session_key] = {'session_id': session_id, 'created_at': time.time()}
-    # TODO Reimplement a proper way.
-    # A lazy hack for SQL literal quoting.
-    return "'" + repr('"' + value)[2:]
+        logger.info(f'Created new session: {session_id} for {cluster_identifier}:{database_name}')
+        return session_id
+    async def _create_session_with_app_name(
+        self, cluster_identifier: str, database_name: str, cluster_info: dict
+    ) -> str:
+        """Create a new session by executing SET application_name.
-def protect_sql(sql: str, allow_read_write: bool) -> list[str]:
-    """Protect SQL depending on if the read-write mode allowed.
+        Args:
+            cluster_identifier: The cluster identifier.
+            database_name: The database name.
+            cluster_info: Cluster information dictionary.
-    The SQL is wrapped in a transaction block with READ ONLY or READ WRITE mode
-    based on allow_read_write flag. Transaction breaker protection is implemented
-    to prevent unauthorized modifications.
+        Returns:
+            Session ID from the ExecuteStatement response.
+        """
+        # Set application name to create session
+        app_name_sql = f"SET application_name TO '{self._app_name}';"
-    The SQL takes the form:
-    BEGIN [READ ONLY|READ WRITE];
-    <sql>
-    END;
+        # Execute statement to create session
+        statement_id = await _execute_statement(
+            cluster_info=cluster_info,
+            cluster_identifier=cluster_identifier,
+            database_name=database_name,
+            sql=app_name_sql,
+            session_keepalive=self._session_keepalive,
+        )
-    Args:
-        sql: The SQL statement to protect.
-        allow_read_write: Indicates if read-write mode should be activated.
+        # Get session ID from the response
+        data_client = client_manager.redshift_data_client()
+        status_response = data_client.describe_statement(Id=statement_id)
+        session_id = status_response['SessionId']
-    Returns:
-        List of strings to execute by batch_execute_statement.
-    """
-    if allow_read_write:
-        return ['BEGIN READ WRITE;', sql, 'END;']
-    else:
-        # Check if SQL contains suspicious patterns trying to break the transaction context
-        if regex.compile(SUSPICIOUS_QUERY_REGEXP).search(sql):
-            logger.error(f'SQL contains suspicious pattern, execution rejected: {sql}')
-            raise Exception(f'SQL contains suspicious pattern, execution rejected: {sql}')
+        logger.debug(f'Created session with application name: {session_id}')
+        return session_id
-        return ['BEGIN READ ONLY;', sql, 'END;']
+    def _is_session_expired(self, session_info: dict) -> bool:
+        """Check if a session has expired based on keepalive timeout.
+        Args:
+            session_info: Session information dictionary.
-async def execute_statement(
-    cluster_identifier: str, database_name: str, sql: str, allow_read_write: bool = False
+        Returns:
+            True if session is expired, False otherwise.
+        """
+        return (time.time() - session_info['created_at']) > self._session_keepalive
+async def _execute_protected_statement(
+    cluster_identifier: str,
+    database_name: str,
+    sql: str,
+    parameters: list[dict] | None = None,
+    allow_read_write: bool = False,
 ) -> tuple[dict, str]:
-    """Execute a SQL statement against a Redshift cluster using the Data API.
+    """Execute a SQL statement against a Redshift cluster in a protected fashion.
+    The SQL is protected by wrapping it in a transaction block with READ ONLY or READ WRITE mode
+    based on allow_read_write flag. Transaction breaker protection is implemented
+    to prevent unauthorized modifications.
-    This is a common function used by other functions in this module.
+    The SQL execution takes the form:
+    1. Get or create session (with SET application_name)
+    2. BEGIN [READ ONLY|READ WRITE];
+    3. <user sql>
+    4. END;
     Args:
         cluster_identifier: The cluster identifier to query.
         database_name: The database to execute the query against.
         sql: The SQL statement to execute.
+        parameters: Optional list of parameter dictionaries with 'name' and 'value' keys.
         allow_read_write: Indicates if read-write mode should be activated.
     Returns:
@@ -166,9 +231,7 @@ async def execute_statement(
     Raises:
         Exception: If cluster not found, query fails, or times out.
     """
-    data_client = client_manager.redshift_data_client()
-    # First, check if this is a provisioned cluster or serverless workgroup
+    # Get cluster info
     clusters = await discover_clusters()
     cluster_info = None
     for cluster in clusters:
@@ -181,57 +244,131 @@ async def execute_statement(
             f'Cluster {cluster_identifier} not found. Please use list_clusters to get valid cluster identifiers.'
         )
-    # Guard from executing read-write statements if not allowed
-    sqls = protect_sql(sql, allow_read_write)
-    # Add application name and version
-    sqls = [f"SET application_name TO '{CLIENT_USER_AGENT_NAME}/{__version__}';"] + sqls
+    # Get session (creates if needed, sets app name automatically)
+    session_id = await session_manager.session(cluster_identifier, database_name, cluster_info)
+    # Check for suspicious patterns in read-only mode
+    if not allow_read_write:
+        if regex.compile(SUSPICIOUS_QUERY_REGEXP).search(sql):
+            logger.error(f'SQL contains suspicious pattern, execution rejected: {sql}')
+            raise Exception(f'SQL contains suspicious pattern, execution rejected: {sql}')
-    logger.debug(f'Protected and versioned SQL: {" ".join(sqls)}')
+    # Execute BEGIN statement
+    begin_sql = 'BEGIN READ WRITE;' if allow_read_write else 'BEGIN READ ONLY;'
+    await _execute_statement(
+        cluster_info=cluster_info,
+        cluster_identifier=cluster_identifier,
+        database_name=database_name,
+        sql=begin_sql,
+        session_id=session_id,
+    )
+    # Execute user SQL with parameters
+    user_query_id = await _execute_statement(
+        cluster_info=cluster_info,
+        cluster_identifier=cluster_identifier,
+        database_name=database_name,
+        sql=sql,
+        parameters=parameters,
+        session_id=session_id,
+    )
+    # Execute END statement to close transaction
+    await _execute_statement(
+        cluster_info=cluster_info,
+        cluster_identifier=cluster_identifier,
+        database_name=database_name,
+        sql='END;',
+        session_id=session_id,
+    )
+    # Get results from user query
+    data_client = client_manager.redshift_data_client()
+    results_response = data_client.get_statement_result(Id=user_query_id)
+    return results_response, user_query_id
-    # Execute the query using Data API
-    if cluster_info['type'] == 'provisioned':
-        logger.debug(f'Using ClusterIdentifier for provisioned cluster: {cluster_identifier}')
-        response = data_client.batch_execute_statement(
-            ClusterIdentifier=cluster_identifier, Database=database_name, Sqls=sqls
-        )
-    elif cluster_info['type'] == 'serverless':
-        logger.debug(f'Using WorkgroupName for serverless workgroup: {cluster_identifier}')
-        response = data_client.batch_execute_statement(
-            WorkgroupName=cluster_identifier, Database=database_name, Sqls=sqls
-        )
-    else:
-        raise Exception(f'Unknown cluster type: {cluster_info["type"]}')
-    query_id = response['Id']
-    logger.debug(f'Started query execution: {query_id}')
+async def _execute_statement(
+    cluster_info: dict,
+    cluster_identifier: str,
+    database_name: str,
+    sql: str,
+    parameters: list[dict] | None = None,
+    session_id: str | None = None,
+    session_keepalive: int | None = None,
+    query_poll_interval: float = QUERY_POLL_INTERVAL,
+    query_timeout: float = QUERY_TIMEOUT,
+) -> str:
+    """Execute a single statement with optional session support and parameters.
+    Args:
+        cluster_info: Cluster information dictionary.
+        cluster_identifier: The cluster identifier.
+        database_name: The database name.
+        sql: The SQL statement to execute.
+        parameters: Optional list of parameter dictionaries with 'name' and 'value' keys.
+        session_id: Optional session ID to use.
+        session_keepalive: Optional session keepalive seconds (only used when session_id is None).
+        query_poll_interval: Polling interval in seconds for checking query status.
+        query_timeout: Maximum time in seconds to wait for query completion.
+    Returns:
+        Statement ID from the ExecuteStatement response.
+    """
+    data_client = client_manager.redshift_data_client()
-    # Wait for query completion
+    # Build request parameters
+    request_params: dict[str, str | int | list[dict]] = {'Sql': sql}
+    # Add database and cluster/workgroup identifier only if not using session
+    if not session_id:
+        request_params['Database'] = database_name
+        if cluster_info['type'] == 'provisioned':
+            request_params['ClusterIdentifier'] = cluster_identifier
+        elif cluster_info['type'] == 'serverless':
+            request_params['WorkgroupName'] = cluster_identifier
+        else:
+            raise Exception(f'Unknown cluster type: {cluster_info["type"]}')
+    # Add parameters if provided
+    if parameters:
+        request_params['Parameters'] = parameters
+    # Add session ID if provided, otherwise add session keepalive
+    if session_id:
+        request_params['SessionId'] = session_id
+    elif session_keepalive is not None:
+        request_params['SessionKeepAliveSeconds'] = session_keepalive
+    response = data_client.execute_statement(**request_params)
+    statement_id = response['Id']
+    logger.debug(
+        f'Executed statement: {statement_id}' + (f' in session {session_id}' if session_id else '')
+    )
+    # Wait for statement completion
     wait_time = 0
-    status_response = {}
-    while wait_time < QUERY_TIMEOUT:
-        status_response = data_client.describe_statement(Id=query_id)
+    while wait_time < query_timeout:
+        status_response = data_client.describe_statement(Id=statement_id)
         status = status_response['Status']
         if status == 'FINISHED':
-            logger.debug(f'Query execution completed: {query_id}')
+            logger.debug(f'Statement completed: {statement_id}')
             break
         elif status in ['FAILED', 'ABORTED']:
             error_msg = status_response.get('Error', 'Unknown error')
-            logger.error(f'Query execution failed: {error_msg}')
-            raise Exception(f'Query failed: {error_msg}')
+            logger.error(f'Statement failed: {error_msg}')
+            raise Exception(f'Statement failed: {error_msg}')
-        # Wait before polling again
-        await asyncio.sleep(QUERY_POLL_INTERVAL)
-        wait_time += QUERY_POLL_INTERVAL
+        await asyncio.sleep(query_poll_interval)
+        wait_time += query_poll_interval
-    if wait_time >= QUERY_TIMEOUT:
-        logger.error(f'Query execution timed out: {query_id}')
-        raise Exception(f'Query timed out after {QUERY_TIMEOUT} seconds')
+    if wait_time >= query_timeout:
+        logger.error(f'Statement timed out: {statement_id}')
+        raise Exception(f'Statement timed out after {wait_time} seconds')
-    # Get user query results
-    subquery2_id = status_response['SubStatements'][2]['Id']
-    results_response = data_client.get_statement_result(Id=subquery2_id)
-    return results_response, subquery2_id
+    return statement_id
 async def discover_clusters() -> list[dict]:
@@ -334,7 +471,7 @@ async def discover_databases(cluster_identifier: str, database_name: str = 'dev'
         logger.info(f'Discovering databases in cluster {cluster_identifier}')
         # Execute the query using the common function
-        results_response, _ = await execute_statement(
+        results_response, _ = await _execute_protected_statement(
             cluster_identifier=cluster_identifier,
             database_name=database_name,
             sql=SVV_REDSHIFT_DATABASES_QUERY,
@@ -379,10 +516,11 @@ async def discover_schemas(cluster_identifier: str, schema_database_name: str) -
         )
         # Execute the query using the common function
-        results_response, _ = await execute_statement(
+        results_response, _ = await _execute_protected_statement(
             cluster_identifier=cluster_identifier,
             database_name=schema_database_name,
-            sql=SVV_ALL_SCHEMAS_QUERY.format(quote_literal_string(schema_database_name)),
+            sql=SVV_ALL_SCHEMAS_QUERY,
+            parameters=[{'name': 'database_name', 'value': schema_database_name}],
         )
         schemas = []
@@ -432,12 +570,14 @@ async def discover_tables(
         )
         # Execute the query using the common function
-        results_response, _ = await execute_statement(
+        results_response, _ = await _execute_protected_statement(
             cluster_identifier=cluster_identifier,
             database_name=table_database_name,
-            sql=SVV_ALL_TABLES_QUERY.format(
-                quote_literal_string(table_database_name), quote_literal_string(table_schema_name)
-            ),
+            sql=SVV_ALL_TABLES_QUERY,
+            parameters=[
+                {'name': 'database_name', 'value': table_database_name},
+                {'name': 'schema_name', 'value': table_schema_name},
+            ],
         )
         tables = []
@@ -490,14 +630,15 @@ async def discover_columns(
         )
         # Execute the query using the common function
-        results_response, _ = await execute_statement(
+        results_response, _ = await _execute_protected_statement(
             cluster_identifier=cluster_identifier,
             database_name=column_database_name,
-            sql=SVV_ALL_COLUMNS_QUERY.format(
-                quote_literal_string(column_database_name),
-                quote_literal_string(column_schema_name),
-                quote_literal_string(column_table_name),
-            ),
+            sql=SVV_ALL_COLUMNS_QUERY,
+            parameters=[
+                {'name': 'database_name', 'value': column_database_name},
+                {'name': 'schema_name', 'value': column_schema_name},
+                {'name': 'table_name', 'value': column_table_name},
+            ],
         )
         columns = []
@@ -554,7 +695,7 @@ async def execute_query(cluster_identifier: str, database_name: str, sql: str) -
         start_time = time.time()
         # Execute the query using the common function
-        results_response, query_id = await execute_statement(
+        results_response, query_id = await _execute_protected_statement(
             cluster_identifier=cluster_identifier, database_name=database_name, sql=sql
         )
@@ -620,3 +761,8 @@ client_manager = RedshiftClientManager(
     aws_region=os.environ.get('AWS_REGION'),
     aws_profile=os.environ.get('AWS_PROFILE'),
 )
+# Global session manager instance
+session_manager = RedshiftSessionManager(
+    session_keepalive=SESSION_KEEPALIVE, app_name=f'{CLIENT_USER_AGENT_NAME}/{__version__}'
+)

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/awslabs/redshift_mcp_server/server.py RENAMED Viewed

@@ -219,7 +219,9 @@ async def list_databases_tool(
     """
     try:
         logger.info(f'Discovering databases on cluster: {cluster_identifier}')
-        databases_data = await discover_databases(cluster_identifier, database_name)
+        databases_data = await discover_databases(
+            cluster_identifier=cluster_identifier, database_name=database_name
+        )
         # Convert to RedshiftDatabase models
         databases = []
@@ -302,7 +304,9 @@ async def list_schemas_tool(
         logger.info(
             f'Discovering schemas in database {schema_database_name} on cluster {cluster_identifier}'
         )
-        schemas_data = await discover_schemas(cluster_identifier, schema_database_name)
+        schemas_data = await discover_schemas(
+            cluster_identifier=cluster_identifier, schema_database_name=schema_database_name
+        )
         # Convert to RedshiftSchema models
         schemas = []
@@ -394,7 +398,9 @@ async def list_tables_tool(
             f'Discovering tables in schema {table_schema_name} in database {table_database_name} on cluster {cluster_identifier}'
         )
         tables_data = await discover_tables(
-            cluster_identifier, table_database_name, table_schema_name
+            cluster_identifier=cluster_identifier,
+            table_database_name=table_database_name,
+            table_schema_name=table_schema_name,
         )
         # Convert to RedshiftTable models
@@ -500,7 +506,10 @@ async def list_columns_tool(
             f'Discovering columns in table {column_table_name} in schema {column_schema_name} in database {column_database_name} on cluster {cluster_identifier}'
         )
         columns_data = await discover_columns(
-            cluster_identifier, column_database_name, column_schema_name, column_table_name
+            cluster_identifier=cluster_identifier,
+            column_database_name=column_database_name,
+            column_schema_name=column_schema_name,
+            column_table_name=column_table_name,
         )
         # Convert to RedshiftColumn models
@@ -594,7 +603,9 @@ async def execute_query_tool(
     """
     try:
         logger.info(f'Executing query on cluster {cluster_identifier} in database {database_name}')
-        query_result_data = await execute_query(cluster_identifier, database_name, sql)
+        query_result_data = await execute_query(
+            cluster_identifier=cluster_identifier, database_name=database_name, sql=sql
+        )
         # Convert to QueryResult model
         query_result = QueryResult(**query_result_data)

{awslabs_redshift_mcp_server-0.0.7 → awslabs_redshift_mcp_server-0.0.8}/pyproject.toml RENAMED Viewed

@@ -2,7 +2,7 @@
 name = "awslabs.redshift-mcp-server"
 # NOTE: "Patch"=9223372036854775807 bumps next release to zero.
-version = "0.0.7"
+version = "0.0.8"
 description = "An AWS Labs Model Context Protocol (MCP) server for Redshift"
 readme = "README.md"

awslabs.redshift-mcp-server 0.0.7__tar.gz → 0.0.8__tar.gz

awslabs.redshift-mcp-server 0.0.7tar.gz → 0.0.8tar.gz