PyPI - MindsDB - Versions diffs - 25.5.4.2__py3-none-any.whl → 25.6.2.0__py3-none-any.whl - Mend

MindsDB 25.5.4.2py3-none-any.whl → 25.6.2.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MindsDB might be problematic. Click here for more details.

Files changed (69) hide show

mindsdb/__about__.py +1 -1
mindsdb/api/a2a/agent.py +28 -25
mindsdb/api/a2a/common/server/server.py +32 -26
mindsdb/api/executor/command_executor.py +69 -14
mindsdb/api/executor/datahub/datanodes/integration_datanode.py +49 -65
mindsdb/api/executor/datahub/datanodes/project_datanode.py +29 -48
mindsdb/api/executor/datahub/datanodes/system_tables.py +35 -61
mindsdb/api/executor/planner/plan_join.py +67 -77
mindsdb/api/executor/planner/query_planner.py +176 -155
mindsdb/api/executor/planner/steps.py +37 -12
mindsdb/api/executor/sql_query/result_set.py +45 -64
mindsdb/api/executor/sql_query/steps/fetch_dataframe.py +14 -18
mindsdb/api/executor/sql_query/steps/fetch_dataframe_partition.py +17 -18
mindsdb/api/executor/sql_query/steps/insert_step.py +13 -33
mindsdb/api/executor/sql_query/steps/subselect_step.py +43 -35
mindsdb/api/executor/utilities/sql.py +42 -48
mindsdb/api/http/namespaces/config.py +1 -1
mindsdb/api/http/namespaces/file.py +14 -23
mindsdb/api/mysql/mysql_proxy/data_types/mysql_datum.py +12 -28
mindsdb/api/mysql/mysql_proxy/data_types/mysql_packets/binary_resultset_row_package.py +59 -50
mindsdb/api/mysql/mysql_proxy/data_types/mysql_packets/resultset_row_package.py +9 -8
mindsdb/api/mysql/mysql_proxy/libs/constants/mysql.py +449 -461
mindsdb/api/mysql/mysql_proxy/utilities/dump.py +87 -36
mindsdb/integrations/handlers/file_handler/file_handler.py +15 -9
mindsdb/integrations/handlers/file_handler/tests/test_file_handler.py +43 -24
mindsdb/integrations/handlers/litellm_handler/litellm_handler.py +10 -3
mindsdb/integrations/handlers/mysql_handler/mysql_handler.py +26 -33
mindsdb/integrations/handlers/oracle_handler/oracle_handler.py +74 -51
mindsdb/integrations/handlers/postgres_handler/postgres_handler.py +305 -98
mindsdb/integrations/handlers/salesforce_handler/salesforce_handler.py +53 -34
mindsdb/integrations/handlers/salesforce_handler/salesforce_tables.py +136 -6
mindsdb/integrations/handlers/snowflake_handler/snowflake_handler.py +334 -83
mindsdb/integrations/libs/api_handler.py +261 -57
mindsdb/integrations/libs/base.py +100 -29
mindsdb/integrations/utilities/files/file_reader.py +99 -73
mindsdb/integrations/utilities/handler_utils.py +23 -8
mindsdb/integrations/utilities/sql_utils.py +35 -40
mindsdb/interfaces/agents/agents_controller.py +196 -192
mindsdb/interfaces/agents/constants.py +7 -1
mindsdb/interfaces/agents/langchain_agent.py +42 -11
mindsdb/interfaces/agents/mcp_client_agent.py +29 -21
mindsdb/interfaces/data_catalog/__init__.py +0 -0
mindsdb/interfaces/data_catalog/base_data_catalog.py +54 -0
mindsdb/interfaces/data_catalog/data_catalog_loader.py +359 -0
mindsdb/interfaces/data_catalog/data_catalog_reader.py +34 -0
mindsdb/interfaces/database/database.py +81 -57
mindsdb/interfaces/database/integrations.py +220 -234
mindsdb/interfaces/database/log.py +72 -104
mindsdb/interfaces/database/projects.py +156 -193
mindsdb/interfaces/file/file_controller.py +21 -65
mindsdb/interfaces/knowledge_base/controller.py +63 -10
mindsdb/interfaces/knowledge_base/evaluate.py +519 -0
mindsdb/interfaces/knowledge_base/llm_client.py +75 -0
mindsdb/interfaces/skills/custom/text2sql/mindsdb_kb_tools.py +83 -43
mindsdb/interfaces/skills/skills_controller.py +54 -36
mindsdb/interfaces/skills/sql_agent.py +109 -86
mindsdb/interfaces/storage/db.py +223 -79
mindsdb/migrations/versions/2025-05-28_a44643042fe8_added_data_catalog_tables.py +118 -0
mindsdb/migrations/versions/2025-06-09_608e376c19a7_updated_data_catalog_data_types.py +58 -0
mindsdb/utilities/config.py +9 -2
mindsdb/utilities/log.py +35 -26
mindsdb/utilities/ml_task_queue/task.py +19 -22
mindsdb/utilities/render/sqlalchemy_render.py +129 -181
mindsdb/utilities/starters.py +40 -0
{mindsdb-25.5.4.2.dist-info → mindsdb-25.6.2.0.dist-info}/METADATA +253 -253
{mindsdb-25.5.4.2.dist-info → mindsdb-25.6.2.0.dist-info}/RECORD +69 -61
{mindsdb-25.5.4.2.dist-info → mindsdb-25.6.2.0.dist-info}/WHEEL +0 -0
{mindsdb-25.5.4.2.dist-info → mindsdb-25.6.2.0.dist-info}/licenses/LICENSE +0 -0
{mindsdb-25.5.4.2.dist-info → mindsdb-25.6.2.0.dist-info}/top_level.txt +0 -0

mindsdb/interfaces/skills/custom/text2sql/mindsdb_kb_tools.py CHANGED Viewed

@@ -6,9 +6,7 @@ from langchain_core.tools import BaseTool
 class KnowledgeBaseListToolInput(BaseModel):
-    tool_input: str = Field(
-        "", description="An empty string to list all knowledge bases."
-    )
+    tool_input: str = Field("", description="An empty string to list all knowledge bases.")
 class KnowledgeBaseListTool(BaseTool):
@@ -21,7 +19,11 @@ class KnowledgeBaseListTool(BaseTool):
     def _run(self, tool_input: str) -> str:
         """List all knowledge bases."""
-        return self.db.get_usable_knowledge_base_names()
+        kb_names = self.db.get_usable_knowledge_base_names()
+        # Convert list to a formatted string for better readability
+        if not kb_names:
+            return "No knowledge bases found."
+        return json.dumps(kb_names)
 class KnowledgeBaseInfoToolInput(BaseModel):
@@ -41,8 +43,27 @@ class KnowledgeBaseInfoTool(BaseTool):
     def _extract_kb_names(self, tool_input: str) -> List[str]:
         """Extract knowledge base names from the tool input."""
+        # First, check if the input is already a list (passed directly from include_knowledge_bases)
+        if isinstance(tool_input, list):
+            return tool_input
+        # Next, try to parse it as JSON in case it was serialized as a JSON string
+        try:
+            parsed_input = json.loads(tool_input)
+            if isinstance(parsed_input, list):
+                return parsed_input
+        except (json.JSONDecodeError, TypeError):
+            pass
+        # Finally, try the original regex pattern for $START$ and $STOP$ markers
         match = re.search(r"\$START\$(.*?)\$STOP\$", tool_input, re.DOTALL)
         if not match:
+            # If no markers found, check if it's a simple comma-separated string
+            if "," in tool_input:
+                return [kb.strip() for kb in tool_input.split(",")]
+            # If it's just a single string without formatting, return it as a single item
+            if tool_input.strip():
+                return [tool_input.strip()]
             return []
         # Extract and clean the knowledge base names
@@ -55,66 +76,84 @@ class KnowledgeBaseInfoTool(BaseTool):
         kb_names = self._extract_kb_names(tool_input)
         if not kb_names:
-            return "No valid knowledge base names provided. Please provide names enclosed in backticks between $START$ and $STOP$."
+            return "No valid knowledge base names provided. Please provide knowledge base names as a list, comma-separated string, or enclosed in backticks between $START$ and $STOP$."
         results = []
         for kb_name in kb_names:
             try:
                 # Get knowledge base schema
-                schema_result = self.db.run_no_throw(
-                    f"DESCRIBE KNOWLEDGE_BASE `{kb_name}`;"
-                )
+                schema_result = self.db.run_no_throw(f"DESCRIBE KNOWLEDGE_BASE `{kb_name}`;")
                 if not schema_result:
-                    results.append(
-                        f"Knowledge base `{kb_name}` not found or has no schema information."
-                    )
+                    results.append(f"Knowledge base `{kb_name}` not found or has no schema information.")
                     continue
-                # Get sample data
-                sample_data = self.db.run_no_throw(
-                    f"SELECT * FROM `{kb_name}` LIMIT 10;"
-                )
                 # Format the results
                 kb_info = f"## Knowledge Base: `{kb_name}`\n\n"
                 # Schema information
                 kb_info += "### Schema Information:\n"
                 kb_info += "```\n"
-                for row in schema_result:
-                    kb_info += f"{json.dumps(row, indent=2)}\n"
+                # Handle different return types for schema_result
+                if isinstance(schema_result, str):
+                    kb_info += f"{schema_result}\n"
+                elif isinstance(schema_result, list):
+                    for row in schema_result:
+                        if isinstance(row, dict):
+                            kb_info += f"{json.dumps(row, indent=2)}\n"
+                        else:
+                            kb_info += f"{str(row)}\n"
+                else:
+                    kb_info += f"{str(schema_result)}\n"
                 kb_info += "```\n\n"
+                # Get sample data
+                sample_data = self.db.run_no_throw(f"SELECT * FROM `{kb_name}` LIMIT 10;")
                 # Sample data
                 kb_info += "### Sample Data:\n"
-                if sample_data:
-                    # Extract column names
-                    columns = list(sample_data[0].keys())
-                    # Create markdown table header
-                    kb_info += "| " + " | ".join(columns) + " |\n"
-                    kb_info += "| " + " | ".join(["---" for _ in columns]) + " |\n"
-                    # Add rows
-                    for row in sample_data:
-                        formatted_row = []
-                        for col in columns:
-                            cell_value = row[col]
-                            if isinstance(cell_value, dict):
-                                cell_value = json.dumps(cell_value, ensure_ascii=False)
-                            formatted_row.append(str(cell_value).replace("|", "\\|"))
-                        kb_info += "| " + " | ".join(formatted_row) + " |\n"
-                else:
+                # Handle different return types for sample_data
+                if not sample_data:
                     kb_info += "No sample data available.\n"
+                elif isinstance(sample_data, str):
+                    kb_info += f"```\n{sample_data}\n```\n"
+                elif isinstance(sample_data, list) and len(sample_data) > 0:
+                    # Only try to extract columns if we have a list of dictionaries
+                    if isinstance(sample_data[0], dict):
+                        # Extract column names
+                        columns = list(sample_data[0].keys())
+                        # Create markdown table header
+                        kb_info += "| " + " | ".join(columns) + " |\n"
+                        kb_info += "| " + " | ".join(["---" for _ in columns]) + " |\n"
+                        # Add rows
+                        for row in sample_data:
+                            formatted_row = []
+                            for col in columns:
+                                cell_value = row[col]
+                                if isinstance(cell_value, dict):
+                                    cell_value = json.dumps(cell_value, ensure_ascii=False)
+                                formatted_row.append(str(cell_value).replace("|", "\\|"))
+                            kb_info += "| " + " | ".join(formatted_row) + " |\n"
+                    else:
+                        # If it's a list but not of dictionaries, just format as text
+                        kb_info += "```\n"
+                        for item in sample_data:
+                            kb_info += f"{str(item)}\n"
+                        kb_info += "```\n"
+                else:
+                    # For any other type, just convert to string
+                    kb_info += f"```\n{str(sample_data)}\n```\n"
                 results.append(kb_info)
             except Exception as e:
-                results.append(
-                    f"Error getting information for knowledge base `{kb_name}`: {str(e)}"
-                )
+                results.append(f"Error getting information for knowledge base `{kb_name}`: {str(e)}")
         return "\n\n".join(results)
@@ -143,9 +182,7 @@ class KnowledgeBaseQueryTool(BaseTool):
         # If not wrapped in delimiters, use the input directly
         # Check for SQL keywords to validate it's likely a query
-        if re.search(
-            r"\b(SELECT|FROM|WHERE|LIMIT|ORDER BY)\b", tool_input, re.IGNORECASE
-        ):
+        if re.search(r"\b(SELECT|FROM|WHERE|LIMIT|ORDER BY)\b", tool_input, re.IGNORECASE):
             return tool_input.strip()
         return ""
@@ -185,6 +222,9 @@ class KnowledgeBaseQueryTool(BaseTool):
                 return table
-            return result
+            # Ensure we always return a string
+            if isinstance(result, (list, dict)):
+                return json.dumps(result, indent=2)
+            return str(result)
         except Exception as e:
             return f"Error executing query: {str(e)}"

mindsdb/interfaces/skills/skills_controller.py CHANGED Viewed

@@ -6,14 +6,19 @@ from sqlalchemy.orm.attributes import flag_modified
 from mindsdb.interfaces.storage import db
 from mindsdb.interfaces.database.projects import ProjectController
+from mindsdb.interfaces.data_catalog.data_catalog_loader import DataCatalogLoader
+from mindsdb.interfaces.skills.skill_tool import SkillType
 from mindsdb.utilities.config import config
+from mindsdb.utilities import log
-default_project = config.get('default_project')
+logger = log.getLogger(__name__)
+default_project = config.get("default_project")
 class SkillsController:
-    '''Handles CRUD operations at the database level for Skills'''
+    """Handles CRUD operations at the database level for Skills"""
     def __init__(self, project_controller: ProjectController = None):
         if project_controller is None:
@@ -21,7 +26,7 @@ class SkillsController:
         self.project_controller = project_controller
     def get_skill(self, skill_name: str, project_name: str = default_project) -> Optional[db.Skills]:
-        '''
+        """
         Gets a skill by name. Skills are expected to have unique names.
         Parameters:
@@ -33,17 +38,17 @@ class SkillsController:
         Raises:
             ValueError: If `project_name` does not exist
-        '''
+        """
         project = self.project_controller.get(name=project_name)
         return db.Skills.query.filter(
             func.lower(db.Skills.name) == func.lower(skill_name),
             db.Skills.project_id == project.id,
-            db.Skills.deleted_at == null()
+            db.Skills.deleted_at == null(),
         ).first()
     def get_skills(self, project_name: Optional[str]) -> List[dict]:
-        '''
+        """
         Gets all skills in a project.
         Parameters:
@@ -54,7 +59,7 @@ class SkillsController:
         Raises:
             ValueError: If `project_name` does not exist
-        '''
+        """
         if project_name is None:
             projects = self.project_controller.get_list()
@@ -63,23 +68,14 @@ class SkillsController:
             project = self.project_controller.get(name=project_name)
             project_ids = [project.id]
-        query = (
-            db.session.query(db.Skills)
-            .filter(
-                db.Skills.project_id.in_(project_ids),
-                db.Skills.deleted_at == null()
-            )
+        query = db.session.query(db.Skills).filter(
+            db.Skills.project_id.in_(project_ids), db.Skills.deleted_at == null()
         )
         return query.all()
-    def add_skill(
-            self,
-            name: str,
-            project_name: str,
-            type: str,
-            params: Dict[str, str] = {}) -> db.Skills:
-        '''
+    def add_skill(self, name: str, project_name: str, type: str, params: Dict[str, str] = {}) -> db.Skills:
+        """
         Adds a skill to the database.
         Parameters:
@@ -93,7 +89,7 @@ class SkillsController:
         Raises:
             ValueError: If `project_name` does not exist or skill already exists
-        '''
+        """
         if project_name is None:
             project_name = default_project
         project = self.project_controller.get(name=project_name)
@@ -101,7 +97,28 @@ class SkillsController:
         skill = self.get_skill(name, project_name)
         if skill is not None:
-            raise ValueError(f'Skill with name already exists: {name}')
+            raise ValueError(f"Skill with name already exists: {name}")
+        # Load metadata to data catalog (if enabled) if the skill is Text-to-SQL.
+        if config.get("data_catalog", {}).get("enabled", False):
+            if type == SkillType.TEXT2SQL.value and "include_tables" in params:
+                # TODO: Is it possible to create a skill with complete access to the database with the new agent syntax?
+                # TODO: Handle the case where `ignore_tables` is provided. Is this a valid parameter?
+                # TODO: Knowledge Bases?
+                database_table_map = {}
+                for table in params["include_tables"]:
+                    parts = table.split(".", 1)
+                    database_table_map[parts[0]] = database_table_map.get(parts[0], []) + [parts[1]]
+                for database_name, table_names in database_table_map.items():
+                    data_catalog_loader = DataCatalogLoader(database_name=database_name, table_names=table_names)
+                    data_catalog_loader.load_metadata()
+            elif type in [SkillType.TEXT2SQL.value, SkillType.TEXT2SQL_LEGACY.value] and "database" in params:
+                data_catalog_loader = DataCatalogLoader(
+                    database_name=params["database"], table_names=params["tables"] if "tables" in params else None
+                )
+                data_catalog_loader.load_metadata()
         new_skill = db.Skills(
             name=name,
@@ -115,13 +132,14 @@ class SkillsController:
         return new_skill
     def update_skill(
-            self,
-            skill_name: str,
-            new_name: str = None,
-            project_name: str = default_project,
-            type: str = None,
-            params: Dict[str, str] = None):
-        '''
+        self,
+        skill_name: str,
+        new_name: str = None,
+        project_name: str = default_project,
+        type: str = None,
+        params: Dict[str, str] = None,
+    ):
+        """
         Updates an existing skill in the database.
         Parameters:
@@ -136,12 +154,12 @@ class SkillsController:
         Raises:
             ValueError: If `project_name` does not exist or skill doesn't exist
-        '''
+        """
         existing_skill = self.get_skill(skill_name, project_name)
         if existing_skill is None:
-            raise ValueError(f'Skill with name not found: {skill_name}')
-        if isinstance(existing_skill.params, dict) and existing_skill.params.get('is_demo') is True:
+            raise ValueError(f"Skill with name not found: {skill_name}")
+        if isinstance(existing_skill.params, dict) and existing_skill.params.get("is_demo") is True:
             raise ValueError("It is forbidden to change properties of the demo object")
         if new_name is not None:
@@ -157,14 +175,14 @@ class SkillsController:
             existing_skill.params = params
             # Some versions of SQL Alchemy won't handle JSON updates correctly without this.
             # See: https://docs.sqlalchemy.org/en/20/orm/session_api.html#sqlalchemy.orm.attributes.flag_modified
-            flag_modified(existing_skill, 'params')
+            flag_modified(existing_skill, "params")
         db.session.commit()
         return existing_skill
     def delete_skill(self, skill_name: str, project_name: str = default_project):
-        '''
+        """
         Deletes a skill by name.
         Parameters:
@@ -173,12 +191,12 @@ class SkillsController:
         Raises:
             ValueError: If `project_name` does not exist or skill doesn't exist
-        '''
+        """
         skill = self.get_skill(skill_name, project_name)
         if skill is None:
             raise ValueError(f"Skill with name doesn't exist: {skill_name}")
-        if isinstance(skill.params, dict) and skill.params.get('is_demo') is True:
+        if isinstance(skill.params, dict) and skill.params.get("is_demo") is True:
             raise ValueError("Unable to delete demo object")
         skill.deleted_at = datetime.datetime.now()
         db.session.commit()

MindsDB 25.5.4.2__py3-none-any.whl → 25.6.2.0__py3-none-any.whl

Potentially problematic release.

MindsDB 25.5.4.2py3-none-any.whl → 25.6.2.0py3-none-any.whl