PyPI - MindsDB - Versions diffs - 25.9.2.0a1__py3-none-any.whl → 25.9.3rc1__py3-none-any.whl - Mend

MindsDB 25.9.2.0a1py3-none-any.whl → 25.9.3rc1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MindsDB might be problematic. Click here for more details.

Files changed (116) hide show

mindsdb/__about__.py +1 -1
mindsdb/__main__.py +39 -20
mindsdb/api/a2a/agent.py +7 -9
mindsdb/api/a2a/common/server/server.py +3 -3
mindsdb/api/a2a/common/server/task_manager.py +4 -4
mindsdb/api/a2a/task_manager.py +15 -17
mindsdb/api/common/middleware.py +9 -11
mindsdb/api/executor/command_executor.py +2 -4
mindsdb/api/executor/datahub/datanodes/datanode.py +2 -2
mindsdb/api/executor/datahub/datanodes/integration_datanode.py +100 -48
mindsdb/api/executor/datahub/datanodes/project_datanode.py +8 -4
mindsdb/api/executor/datahub/datanodes/system_tables.py +1 -1
mindsdb/api/executor/exceptions.py +29 -10
mindsdb/api/executor/planner/plan_join.py +17 -3
mindsdb/api/executor/sql_query/sql_query.py +74 -74
mindsdb/api/executor/sql_query/steps/fetch_dataframe.py +1 -2
mindsdb/api/executor/sql_query/steps/subselect_step.py +0 -1
mindsdb/api/executor/utilities/functions.py +6 -6
mindsdb/api/executor/utilities/sql.py +32 -16
mindsdb/api/http/gui.py +5 -11
mindsdb/api/http/initialize.py +8 -10
mindsdb/api/http/namespaces/agents.py +10 -12
mindsdb/api/http/namespaces/analysis.py +13 -20
mindsdb/api/http/namespaces/auth.py +1 -1
mindsdb/api/http/namespaces/config.py +15 -11
mindsdb/api/http/namespaces/databases.py +140 -201
mindsdb/api/http/namespaces/file.py +15 -4
mindsdb/api/http/namespaces/handlers.py +7 -2
mindsdb/api/http/namespaces/knowledge_bases.py +8 -7
mindsdb/api/http/namespaces/models.py +94 -126
mindsdb/api/http/namespaces/projects.py +13 -22
mindsdb/api/http/namespaces/sql.py +33 -25
mindsdb/api/http/namespaces/tab.py +27 -37
mindsdb/api/http/namespaces/views.py +1 -1
mindsdb/api/http/start.py +14 -8
mindsdb/api/mcp/__init__.py +2 -1
mindsdb/api/mysql/mysql_proxy/executor/mysql_executor.py +15 -20
mindsdb/api/mysql/mysql_proxy/mysql_proxy.py +26 -50
mindsdb/api/mysql/mysql_proxy/utilities/__init__.py +0 -1
mindsdb/api/postgres/postgres_proxy/executor/executor.py +6 -13
mindsdb/api/postgres/postgres_proxy/postgres_packets/postgres_packets.py +40 -28
mindsdb/integrations/handlers/byom_handler/byom_handler.py +168 -185
mindsdb/integrations/handlers/file_handler/file_handler.py +7 -0
mindsdb/integrations/handlers/lightwood_handler/functions.py +45 -79
mindsdb/integrations/handlers/postgres_handler/postgres_handler.py +13 -1
mindsdb/integrations/handlers/shopify_handler/shopify_handler.py +25 -12
mindsdb/integrations/handlers/snowflake_handler/snowflake_handler.py +2 -1
mindsdb/integrations/handlers/statsforecast_handler/requirements.txt +1 -0
mindsdb/integrations/handlers/statsforecast_handler/requirements_extra.txt +1 -0
mindsdb/integrations/handlers/web_handler/urlcrawl_helpers.py +4 -4
mindsdb/integrations/libs/api_handler.py +10 -10
mindsdb/integrations/libs/base.py +4 -4
mindsdb/integrations/libs/llm/utils.py +2 -2
mindsdb/integrations/libs/ml_handler_process/create_engine_process.py +4 -7
mindsdb/integrations/libs/ml_handler_process/func_call_process.py +2 -7
mindsdb/integrations/libs/ml_handler_process/learn_process.py +37 -47
mindsdb/integrations/libs/ml_handler_process/update_engine_process.py +4 -7
mindsdb/integrations/libs/ml_handler_process/update_process.py +2 -7
mindsdb/integrations/libs/process_cache.py +132 -140
mindsdb/integrations/libs/response.py +18 -12
mindsdb/integrations/libs/vectordatabase_handler.py +26 -0
mindsdb/integrations/utilities/files/file_reader.py +6 -7
mindsdb/integrations/utilities/rag/config_loader.py +37 -26
mindsdb/integrations/utilities/rag/rerankers/base_reranker.py +59 -9
mindsdb/integrations/utilities/rag/rerankers/reranker_compressor.py +4 -4
mindsdb/integrations/utilities/rag/retrievers/sql_retriever.py +55 -133
mindsdb/integrations/utilities/rag/settings.py +58 -133
mindsdb/integrations/utilities/rag/splitters/file_splitter.py +5 -15
mindsdb/interfaces/agents/agents_controller.py +2 -1
mindsdb/interfaces/agents/constants.py +0 -2
mindsdb/interfaces/agents/litellm_server.py +34 -58
mindsdb/interfaces/agents/mcp_client_agent.py +10 -10
mindsdb/interfaces/agents/mindsdb_database_agent.py +5 -5
mindsdb/interfaces/agents/run_mcp_agent.py +12 -21
mindsdb/interfaces/chatbot/chatbot_task.py +20 -23
mindsdb/interfaces/chatbot/polling.py +30 -18
mindsdb/interfaces/data_catalog/data_catalog_loader.py +10 -10
mindsdb/interfaces/database/integrations.py +19 -2
mindsdb/interfaces/file/file_controller.py +6 -6
mindsdb/interfaces/functions/controller.py +1 -1
mindsdb/interfaces/functions/to_markdown.py +2 -2
mindsdb/interfaces/jobs/jobs_controller.py +5 -5
mindsdb/interfaces/jobs/scheduler.py +3 -8
mindsdb/interfaces/knowledge_base/controller.py +50 -23
mindsdb/interfaces/knowledge_base/preprocessing/json_chunker.py +40 -61
mindsdb/interfaces/model/model_controller.py +170 -166
mindsdb/interfaces/query_context/context_controller.py +14 -2
mindsdb/interfaces/skills/custom/text2sql/mindsdb_sql_toolkit.py +6 -4
mindsdb/interfaces/skills/retrieval_tool.py +43 -50
mindsdb/interfaces/skills/skill_tool.py +2 -2
mindsdb/interfaces/skills/sql_agent.py +25 -19
mindsdb/interfaces/storage/fs.py +114 -169
mindsdb/interfaces/storage/json.py +19 -18
mindsdb/interfaces/tabs/tabs_controller.py +49 -72
mindsdb/interfaces/tasks/task_monitor.py +3 -9
mindsdb/interfaces/tasks/task_thread.py +7 -9
mindsdb/interfaces/triggers/trigger_task.py +7 -13
mindsdb/interfaces/triggers/triggers_controller.py +47 -50
mindsdb/migrations/migrate.py +16 -16
mindsdb/utilities/api_status.py +58 -0
mindsdb/utilities/config.py +49 -0
mindsdb/utilities/exception.py +40 -1
mindsdb/utilities/fs.py +0 -1
mindsdb/utilities/hooks/profiling.py +17 -14
mindsdb/utilities/langfuse.py +40 -45
mindsdb/utilities/log.py +272 -0
mindsdb/utilities/ml_task_queue/consumer.py +52 -58
mindsdb/utilities/ml_task_queue/producer.py +26 -30
mindsdb/utilities/render/sqlalchemy_render.py +7 -6
mindsdb/utilities/utils.py +2 -2
{mindsdb-25.9.2.0a1.dist-info → mindsdb-25.9.3rc1.dist-info}/METADATA +269 -264
{mindsdb-25.9.2.0a1.dist-info → mindsdb-25.9.3rc1.dist-info}/RECORD +115 -115
mindsdb/api/mysql/mysql_proxy/utilities/exceptions.py +0 -14
{mindsdb-25.9.2.0a1.dist-info → mindsdb-25.9.3rc1.dist-info}/WHEEL +0 -0
{mindsdb-25.9.2.0a1.dist-info → mindsdb-25.9.3rc1.dist-info}/licenses/LICENSE +0 -0
{mindsdb-25.9.2.0a1.dist-info → mindsdb-25.9.3rc1.dist-info}/top_level.txt +0 -0

mindsdb/integrations/handlers/byom_handler/byom_handler.py CHANGED Viewed

@@ -1,4 +1,4 @@
-""" BYOM: Bring Your Own Model
+"""BYOM: Bring Your Own Model
 env vars to contloll BYOM:
  - MINDSDB_BYOM_ENABLED - can BYOM be uysed or not. Locally enabled by default.
@@ -7,7 +7,6 @@ env vars to contloll BYOM:
  - MINDSDB_BYOM_TYPE - [safe|unsafe] - obsolete, same as above.
 """
 import os
 import re
 import sys
@@ -15,7 +14,6 @@ import shutil
 import pickle
 import tarfile
 import tempfile
-import traceback
 import subprocess
 from enum import Enum
 from pathlib import Path
@@ -36,28 +34,33 @@ import mindsdb.utilities.profiler as profiler
 from .proc_wrapper import (
-    pd_decode, pd_encode, encode, decode, BYOM_METHOD,
-    import_string, find_model_class, check_module
+    pd_decode,
+    pd_encode,
+    encode,
+    decode,
+    BYOM_METHOD,
+    import_string,
+    find_model_class,
+    check_module,
 )
 from .__about__ import __version__
-BYOM_TYPE = Enum('BYOM_TYPE', ['INHOUSE', 'VENV'])
+BYOM_TYPE = Enum("BYOM_TYPE", ["INHOUSE", "VENV"])
 logger = log.getLogger(__name__)
 class BYOMHandler(BaseMLEngine):
-    name = 'byom'
+    name = "byom"
     def __init__(self, model_storage, engine_storage, **kwargs) -> None:
         # region check availability
-        is_cloud = Config().get('cloud', False)
+        is_cloud = Config().get("cloud", False)
         if is_cloud is True:
-            byom_enabled = os.environ.get('MINDSDB_BYOM_ENABLED', 'false').lower()
-            if byom_enabled not in ('true', '1'):
-                raise RuntimeError('BYOM is disabled on cloud')
+            byom_enabled = os.environ.get("MINDSDB_BYOM_ENABLED", "false").lower()
+            if byom_enabled not in ("true", "1"):
+                raise RuntimeError("BYOM is disabled on cloud")
         # endregion
         self.model_wrapper = None
@@ -68,16 +71,14 @@ class BYOMHandler(BaseMLEngine):
         # region read and save set default byom type
         try:
             self._default_byom_type = BYOM_TYPE.VENV
-            if os.environ.get('MINDSDB_BYOM_DEFAULT_TYPE') is not None:
-                self._default_byom_type = BYOM_TYPE[
-                    os.environ.get('MINDSDB_BYOM_DEFAULT_TYPE').upper()
-                ]
+            if os.environ.get("MINDSDB_BYOM_DEFAULT_TYPE") is not None:
+                self._default_byom_type = BYOM_TYPE[os.environ.get("MINDSDB_BYOM_DEFAULT_TYPE").upper()]
             else:
-                env_var = os.environ.get('MINDSDB_BYOM_DEFAULT_TYPE')
-                if env_var == 'SAVE':
-                    self._default_byom_type = BYOM_TYPE['VENV']
-                elif env_var == 'UNSAVE':
-                    self._default_byom_type = BYOM_TYPE['INHOUSE']
+                env_var = os.environ.get("MINDSDB_BYOM_DEFAULT_TYPE")
+                if env_var == "SAVE":
+                    self._default_byom_type = BYOM_TYPE["VENV"]
+                elif env_var == "UNSAVE":
+                    self._default_byom_type = BYOM_TYPE["INHOUSE"]
                 else:
                     raise KeyError
         except KeyError:
@@ -85,11 +86,11 @@ class BYOMHandler(BaseMLEngine):
         # endregion
         # region check if 'inhouse' BYOM is enabled
-        env_var = os.environ.get('MINDSDB_BYOM_INHOUSE_ENABLED')
+        env_var = os.environ.get("MINDSDB_BYOM_INHOUSE_ENABLED")
         if env_var is None:
             self._inhouse_enabled = False if is_cloud else True
         else:
-            self._inhouse_enabled = env_var.lower() in ('true', '1')
+            self._inhouse_enabled = env_var.lower() in ("true", "1")
         # endregion
         super().__init__(model_storage, engine_storage, **kwargs)
@@ -117,18 +118,18 @@ class BYOMHandler(BaseMLEngine):
     def create_validation(target: str, args: dict = None, **kwargs) -> None:
         if isinstance(args, dict) is False:
             return
-        using_args = args.get('using', {})
-        engine_version = using_args.get('engine_version')
+        using_args = args.get("using", {})
+        engine_version = using_args.get("engine_version")
         if engine_version is not None:
             engine_version = BYOMHandler.normalize_engine_version(engine_version)
         else:
-            connection_args = kwargs['handler_storage'].get_connection_args()
-            versions = connection_args.get('versions')
+            connection_args = kwargs["handler_storage"].get_connection_args()
+            versions = connection_args.get("versions")
             if isinstance(versions, dict):
                 engine_version = max([int(x) for x in versions.keys()])
             else:
                 engine_version = 1
-            using_args['engine_version'] = engine_version
+            using_args["engine_version"] = engine_version
     def get_model_engine_version(self) -> int:
         """Return current model engine version
@@ -136,7 +137,7 @@ class BYOMHandler(BaseMLEngine):
         Returns:
             int: engine version
         """
-        engine_version = self.model_storage.get_info()['learn_args'].get('using', {}).get('engine_version')
+        engine_version = self.model_storage.get_info()["learn_args"].get("using", {}).get("engine_version")
         engine_version = BYOMHandler.normalize_engine_version(engine_version)
         return engine_version
@@ -154,28 +155,26 @@ class BYOMHandler(BaseMLEngine):
             version = 1
         if isinstance(version, str):
             version = int(version)
-        version_mark = ''
+        version_mark = ""
         if version > 1:
-            version_mark = f'_{version}'
+            version_mark = f"_{version}"
         version_str = str(version)
         self.engine_storage.fileStorage.pull()
         try:
-            code = self.engine_storage.fileStorage.file_get(f'code{version_mark}')
-            modules_str = self.engine_storage.fileStorage.file_get(f'modules{version_mark}')
+            code = self.engine_storage.fileStorage.file_get(f"code{version_mark}")
+            modules_str = self.engine_storage.fileStorage.file_get(f"modules{version_mark}")
         except FileNotFoundError:
             raise Exception(f"Engine version '{version}' does not exists")
         if version_str not in self.model_wrappers:
             connection_args = self.engine_storage.get_connection_args()
-            version_meta = connection_args['versions'][version_str]
+            version_meta = connection_args["versions"][version_str]
             try:
-                engine_version_type = BYOM_TYPE[
-                    version_meta.get('type', self._default_byom_type.name).upper()
-                ]
+                engine_version_type = BYOM_TYPE[version_meta.get("type", self._default_byom_type.name).upper()]
             except KeyError:
-                raise Exception('Unknown BYOM engine type')
+                raise Exception("Unknown BYOM engine type")
             if engine_version_type == BYOM_TYPE.INHOUSE:
                 if self._inhouse_enabled is False:
@@ -185,20 +184,20 @@ class BYOMHandler(BaseMLEngine):
                         code=code,
                         modules_str=modules_str,
                         engine_id=self.engine_storage.integration_id,
-                        engine_version=version
+                        engine_version=version,
                     )
                 self.model_wrappers[version_str] = self.inhouse_model_wrapper
             elif engine_version_type == BYOM_TYPE.VENV:
-                if version_meta.get('venv_status') != 'ready':
-                    version_meta['venv_status'] = 'creating'
+                if version_meta.get("venv_status") != "ready":
+                    version_meta["venv_status"] = "creating"
                     self.engine_storage.update_connection_args(connection_args)
                 self.model_wrappers[version_str] = ModelWrapperSafe(
                     code=code,
                     modules_str=modules_str,
                     engine_id=self.engine_storage.integration_id,
-                    engine_version=version
+                    engine_version=version,
                 )
-                version_meta['venv_status'] = 'ready'
+                version_meta["venv_status"] = "ready"
                 self.engine_storage.update_connection_args(connection_args)
         return self.model_wrappers[version_str]
@@ -206,130 +205,114 @@ class BYOMHandler(BaseMLEngine):
     def describe(self, attribute: Optional[str] = None) -> pd.DataFrame:
         engine_version = self.get_model_engine_version()
         mp = self._get_model_proxy(engine_version)
-        model_state = self.model_storage.file_get('model')
+        model_state = self.model_storage.file_get("model")
         return mp.describe(model_state, attribute)
     def create(self, target, df=None, args=None, **kwargs):
-        using_args = args.get('using', {})
-        engine_version = using_args.get('engine_version')
+        using_args = args.get("using", {})
+        engine_version = using_args.get("engine_version")
         model_proxy = self._get_model_proxy(engine_version)
         model_state = model_proxy.train(df, target, args)
-        self.model_storage.file_set('model', model_state)
+        self.model_storage.file_set("model", model_state)
         # TODO return columns?
         def convert_type(field_type):
             if pd_types.is_integer_dtype(field_type):
-                return 'integer'
+                return "integer"
             elif pd_types.is_numeric_dtype(field_type):
-                return 'float'
+                return "float"
             elif pd_types.is_datetime64_any_dtype(field_type):
-                return 'datetime'
+                return "datetime"
             else:
-                return 'categorical'
+                return "categorical"
-        columns = {
-            target: convert_type(object)
-        }
+        columns = {target: convert_type(object)}
         self.model_storage.columns_set(columns)
     def predict(self, df, args=None):
-        pred_args = args.get('predict_params', {})
+        pred_args = args.get("predict_params", {})
-        engine_version = pred_args.get('engine_version')
+        engine_version = pred_args.get("engine_version")
         if engine_version is not None:
             engine_version = int(engine_version)
         else:
             engine_version = self.get_model_engine_version()
         model_proxy = self._get_model_proxy(engine_version)
-        model_state = self.model_storage.file_get('model')
+        model_state = self.model_storage.file_get("model")
         pred_df = model_proxy.predict(df, model_state, pred_args)
         return pred_df
     def create_engine(self, connection_args):
-        code_path = Path(connection_args['code'])
-        self.engine_storage.fileStorage.file_set(
-            'code',
-            code_path.read_bytes()
-        )
+        code_path = Path(connection_args["code"])
+        self.engine_storage.fileStorage.file_set("code", code_path.read_bytes())
-        requirements_path = Path(connection_args['modules'])
-        self.engine_storage.fileStorage.file_set(
-            'modules',
-            requirements_path.read_bytes()
-        )
+        requirements_path = Path(connection_args["modules"])
+        self.engine_storage.fileStorage.file_set("modules", requirements_path.read_bytes())
         self.engine_storage.fileStorage.push()
-        self.engine_storage.update_connection_args({
-            'handler_version': __version__,
-            'mode': connection_args.get('mode'),
-            'versions': {
-                '1': {
-                    'code': code_path.name,
-                    'requirements': requirements_path.name,
-                    'type': self.normalize_byom_type(
-                        connection_args.get('type')
-                    ).name.lower()
-                }
+        self.engine_storage.update_connection_args(
+            {
+                "handler_version": __version__,
+                "mode": connection_args.get("mode"),
+                "versions": {
+                    "1": {
+                        "code": code_path.name,
+                        "requirements": requirements_path.name,
+                        "type": self.normalize_byom_type(connection_args.get("type")).name.lower(),
+                    }
+                },
             }
-        })
+        )
         model_proxy = self._get_model_proxy()
         try:
-            info = model_proxy.check(connection_args.get('mode'))
-            self.engine_storage.json_set('methods', info['methods'])
+            info = model_proxy.check(connection_args.get("mode"))
+            self.engine_storage.json_set("methods", info["methods"])
         except Exception as e:
-            if hasattr(model_proxy, 'remove_venv'):
+            if hasattr(model_proxy, "remove_venv"):
                 model_proxy.remove_venv()
             raise e
     def update_engine(self, connection_args: dict) -> None:
         """Add new version of engine
-            Args:
-                connection_args (dict): paths to code and requirements
+        Args:
+            connection_args (dict): paths to code and requirements
         """
-        code_path = Path(connection_args['code'])
-        requirements_path = Path(connection_args['modules'])
+        code_path = Path(connection_args["code"])
+        requirements_path = Path(connection_args["modules"])
         engine_connection_args = self.engine_storage.get_connection_args()
-        if isinstance(engine_connection_args, dict) is False or 'handler_version' not in engine_connection_args:
+        if isinstance(engine_connection_args, dict) is False or "handler_version" not in engine_connection_args:
             engine_connection_args = {
-                'handler_version': __version__,
-                'versions': {
-                    '1': {
-                        'code': 'code.py',
-                        'requirements': 'requirements.txt',
-                        'type': self._default_byom_type.name.lower()
+                "handler_version": __version__,
+                "versions": {
+                    "1": {
+                        "code": "code.py",
+                        "requirements": "requirements.txt",
+                        "type": self._default_byom_type.name.lower(),
                     }
-                }
+                },
             }
-        new_version = str(max([int(x) for x in engine_connection_args['versions'].keys()]) + 1)
-        engine_connection_args['versions'][new_version] = {
-            'code': code_path.name,
-            'requirements': requirements_path.name,
-            'type': self.normalize_byom_type(
-                connection_args.get('type')
-            ).name.lower()
+        new_version = str(max([int(x) for x in engine_connection_args["versions"].keys()]) + 1)
+        engine_connection_args["versions"][new_version] = {
+            "code": code_path.name,
+            "requirements": requirements_path.name,
+            "type": self.normalize_byom_type(connection_args.get("type")).name.lower(),
         }
-        self.engine_storage.fileStorage.file_set(
-            f'code_{new_version}',
-            code_path.read_bytes()
-        )
+        self.engine_storage.fileStorage.file_set(f"code_{new_version}", code_path.read_bytes())
-        self.engine_storage.fileStorage.file_set(
-            f'modules_{new_version}',
-            requirements_path.read_bytes()
-        )
+        self.engine_storage.fileStorage.file_set(f"modules_{new_version}", requirements_path.read_bytes())
         self.engine_storage.fileStorage.push()
         self.engine_storage.update_connection_args(engine_connection_args)
@@ -337,28 +320,28 @@ class BYOMHandler(BaseMLEngine):
         model_proxy = self._get_model_proxy(new_version)
         try:
             methods = model_proxy.check()
-            self.engine_storage.json_set('methods', methods)
+            self.engine_storage.json_set("methods", methods)
         except Exception as e:
-            if hasattr(model_proxy, 'remove_venv'):
+            if hasattr(model_proxy, "remove_venv"):
                 model_proxy.remove_venv()
             raise e
     def function_list(self):
-        return self.engine_storage.json_get('methods')
+        return self.engine_storage.json_get("methods")
     def function_call(self, name, args):
         mp = self._get_model_proxy()
         return mp.func_call(name, args)
     def finetune(self, df: Optional[pd.DataFrame] = None, args: Optional[Dict] = None) -> None:
-        using_args = args.get('using', {})
-        engine_version = using_args.get('engine_version')
+        using_args = args.get("using", {})
+        engine_version = using_args.get("engine_version")
         model_storage = self.model_storage
         # TODO: should probably refactor at some point, as a bit of the logic is shared with lightwood's finetune logic
         try:
-            base_predictor_id = args['base_model_id']
+            base_predictor_id = args["base_model_id"]
             base_predictor_record = db.Predictor.query.get(base_predictor_id)
             if base_predictor_record.status != PREDICTOR_STATUS.COMPLETE:
                 raise Exception("Base model must be in status 'complete'")
@@ -366,33 +349,34 @@ class BYOMHandler(BaseMLEngine):
             predictor_id = model_storage.predictor_id
             predictor_record = db.Predictor.query.get(predictor_id)
-            predictor_record.data = {'training_log': 'training'}  # TODO move to ModelStorage (don't work w/ db directly)
+            predictor_record.data = {
+                "training_log": "training"
+            }  # TODO move to ModelStorage (don't work w/ db directly)
             predictor_record.training_start_at = datetime.now()
             predictor_record.status = PREDICTOR_STATUS.FINETUNING  # TODO: parallel execution block
             db.session.commit()
             model_proxy = self._get_model_proxy(engine_version)
-            model_state = self.base_model_storage.file_get('model')
-            model_state = model_proxy.finetune(df, model_state, args=args.get('using', {}))
+            model_state = self.base_model_storage.file_get("model")
+            model_state = model_proxy.finetune(df, model_state, args=args.get("using", {}))
             # region hack to speedup file saving
-            with profiler.Context('finetune-byom-write-file'):
-                dest_abs_path = model_storage.fileStorage.folder_path / 'model'
-                with open(dest_abs_path, 'wb') as fd:
+            with profiler.Context("finetune-byom-write-file"):
+                dest_abs_path = model_storage.fileStorage.folder_path / "model"
+                with open(dest_abs_path, "wb") as fd:
                     fd.write(model_state)
                 model_storage.fileStorage.push(compression_level=0)
             # endregion
-            predictor_record.update_status = 'up_to_date'
+            predictor_record.update_status = "up_to_date"
             predictor_record.status = PREDICTOR_STATUS.COMPLETE
             predictor_record.training_stop_at = datetime.now()
             db.session.commit()
         except Exception as e:
-            logger.error(e)
+            logger.error("Unexpected error during BYOM finetune:", exc_info=True)
             predictor_id = model_storage.predictor_id
             predictor_record = db.Predictor.query.with_for_update().get(predictor_id)
-            logger.error(traceback.format_exc())
             error_message = format_exception_error(e)
             predictor_record.data = {"error": error_message}
             predictor_record.status = PREDICTOR_STATUS.ERROR
@@ -406,8 +390,7 @@ class BYOMHandler(BaseMLEngine):
 class ModelWrapperUnsafe:
-    """ Model wrapper that executes learn/predict in current process
-    """
+    """Model wrapper that executes learn/predict in current process"""
     def __init__(self, code, modules_str, engine_id, engine_version: int):
         self.module = import_string(code)
@@ -444,7 +427,7 @@ class ModelWrapperUnsafe:
         return pickle.dumps(self.model_instance.__dict__, protocol=5)
     def describe(self, model_state, attribute: Optional[str] = None) -> pd.DataFrame:
-        if hasattr(self.model_instance, 'describe'):
+        if hasattr(self.model_instance, "describe"):
             model_state = pickle.loads(model_state)
             self.model_instance.__dict__ = model_state
             return self.model_instance.describe(attribute)
@@ -460,15 +443,14 @@ class ModelWrapperUnsafe:
 class ModelWrapperSafe:
-    """ Model wrapper that executes learn/predict in venv
-    """
+    """Model wrapper that executes learn/predict in venv"""
     def __init__(self, code, modules_str, engine_id, engine_version: int):
         self.code = code
         modules = self.parse_requirements(modules_str)
         self.config = Config()
-        self.is_cloud = Config().get('cloud', False)
+        self.is_cloud = Config().get("cloud", False)
         self.env_path = None
         self.env_storage_path = None
@@ -478,37 +460,37 @@ class ModelWrapperSafe:
         try:
             import virtualenv
-            base_path = self.config.get('byom', {}).get('venv_path')
+            base_path = self.config.get("byom", {}).get("venv_path")
             if base_path is None:
                 # create in root path
-                base_path = Path(self.config.paths['root']) / 'venvs'
+                base_path = Path(self.config.paths["root"]) / "venvs"
             else:
                 base_path = Path(base_path)
             base_path.mkdir(parents=True, exist_ok=True)
-            env_folder_name = f'env_{engine_id}'
+            env_folder_name = f"env_{engine_id}"
             if isinstance(engine_version, int) and engine_version > 1:
-                env_folder_name = f'{env_folder_name}_{engine_version}'
+                env_folder_name = f"{env_folder_name}_{engine_version}"
             self.env_storage_path = base_path / env_folder_name
             if self.is_cloud:
-                bese_env_path = Path(tempfile.gettempdir()) / 'mindsdb' / 'venv'
+                bese_env_path = Path(tempfile.gettempdir()) / "mindsdb" / "venv"
                 bese_env_path.mkdir(parents=True, exist_ok=True)
                 self.env_path = bese_env_path / env_folder_name
-                tar_path = self.env_storage_path.with_suffix('.tar')
+                tar_path = self.env_storage_path.with_suffix(".tar")
                 if self.env_path.exists() is False and tar_path.exists() is True:
                     with tarfile.open(tar_path) as tar:
                         safe_extract(tar, path=bese_env_path)
             else:
                 self.env_path = self.env_storage_path
-            if sys.platform in ('win32', 'cygwin'):
-                exectable_folder_name = 'Scripts'
+            if sys.platform in ("win32", "cygwin"):
+                exectable_folder_name = "Scripts"
             else:
-                exectable_folder_name = 'bin'
+                exectable_folder_name = "bin"
-            pip_cmd = self.env_path / exectable_folder_name / 'pip'
-            self.python_path = self.env_path / exectable_folder_name / 'python'
+            pip_cmd = self.env_path / exectable_folder_name / "pip"
+            self.python_path = self.env_path / exectable_folder_name / "python"
             if self.env_path.exists():
                 # already exists. it means requirements are already installed
@@ -516,7 +498,7 @@ class ModelWrapperSafe:
             # create
             logger.info(f"Creating new environment: {self.env_path}")
-            virtualenv.cli_run(['-p', sys.executable, str(self.env_path)])
+            virtualenv.cli_run(["-p", sys.executable, str(self.env_path)])
             logger.info(f"Created new environment: {self.env_path}")
             if len(modules) > 0:
@@ -537,13 +519,14 @@ class ModelWrapperSafe:
         if self.is_cloud and self.env_storage_path != self.env_path:
             old_cwd = os.getcwd()
             os.chdir(str(bese_env_path))
-            tar_path = self.env_path.with_suffix('.tar')
-            with tarfile.open(name=str(tar_path), mode='w') as tar:
+            tar_path = self.env_path.with_suffix(".tar")
+            with tarfile.open(name=str(tar_path), mode="w") as tar:
                 tar.add(str(self.env_path.name))
             os.chdir(old_cwd)
             subprocess.run(
-                ['cp', '-R', '--no-preserve=mode,ownership', str(tar_path), str(base_path / tar_path.name)],
-                check=True, shell=False
+                ["cp", "-R", "--no-preserve=mode,ownership", str(tar_path), str(base_path / tar_path.name)],
+                check=True,
+                shell=False,
             )
             tar_path.unlink()
@@ -552,46 +535,46 @@ class ModelWrapperSafe:
             shutil.rmtree(str(self.env_path))
         if self.is_cloud:
-            tar_path = self.env_storage_path.with_suffix('.tar')
+            tar_path = self.env_storage_path.with_suffix(".tar")
             tar_path.unlink()
     def parse_requirements(self, requirements):
         # get requirements from string
         # they should be located at the top of the file, before code
-        pattern = '^[\w\\[\\]-]+[=!<>\s]*[\d\.]*[,=!<>\s]*[\d\.]*$'  # noqa
+        pattern = "^[\w\\[\\]-]+[=!<>\s]*[\d\.]*[,=!<>\s]*[\d\.]*$"  # noqa
         modules = []
-        for line in requirements.split(b'\n'):
+        for line in requirements.split(b"\n"):
             line = line.decode().strip()
             if line:
                 if re.match(pattern, line):
                     modules.append(line)
                 else:
-                    raise Exception(f'Wrong requirement: {line}')
+                    raise Exception(f"Wrong requirement: {line}")
-        is_pandas = any([m.lower().startswith('pandas') for m in modules])
+        is_pandas = any([m.lower().startswith("pandas") for m in modules])
         if not is_pandas:
-            modules.append('pandas>=2.0.0,<2.1.0')
-            modules.append('numpy<2.0.0')
+            modules.append("pandas>=2.0.0,<2.1.0")
+            modules.append("numpy<2.0.0")
         # for dataframe serialization
-        modules.append('pyarrow==19.0.0')
+        modules.append("pyarrow==19.0.0")
         return modules
     def install_modules(self, modules, pip_cmd):
         # install in current environment using pip
         for module in modules:
             logger.debug(f"BYOM install module: {module}")
-            p = subprocess.Popen([pip_cmd, 'install', module], stderr=subprocess.PIPE)
+            p = subprocess.Popen([pip_cmd, "install", module], stderr=subprocess.PIPE)
             p.wait()
             if p.returncode != 0:
-                raise Exception(f'Problem with installing module {module}: {p.stderr.read()}')
+                raise Exception(f"Problem with installing module {module}: {p.stderr.read()}")
     def _run_command(self, params):
         logger.debug(f"BYOM run command: {params.get('method')}")
         params_enc = encode(params)
-        wrapper_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'proc_wrapper.py')
+        wrapper_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), "proc_wrapper.py")
         p = subprocess.Popen(
             [str(self.python_path), wrapper_path],
             stdin=subprocess.PIPE,
@@ -613,44 +596,44 @@ class ModelWrapperSafe:
     def check(self, mode: str = None):
         params = {
-            'method': BYOM_METHOD.CHECK.value,
-            'code': self.code,
-            'mode': mode,
+            "method": BYOM_METHOD.CHECK.value,
+            "code": self.code,
+            "mode": mode,
         }
         return self._run_command(params)
     def train(self, df, target, args):
         params = {
-            'method': BYOM_METHOD.TRAIN.value,
-            'code': self.code,
-            'df': None,
-            'to_predict': target,
-            'args': args,
+            "method": BYOM_METHOD.TRAIN.value,
+            "code": self.code,
+            "df": None,
+            "to_predict": target,
+            "args": args,
         }
         if df is not None:
-            params['df'] = pd_encode(df)
+            params["df"] = pd_encode(df)
         model_state = self._run_command(params)
         return model_state
     def predict(self, df, model_state, args):
         params = {
-            'method': BYOM_METHOD.PREDICT.value,
-            'code': self.code,
-            'model_state': model_state,
-            'df': pd_encode(df),
-            'args': args,
+            "method": BYOM_METHOD.PREDICT.value,
+            "code": self.code,
+            "model_state": model_state,
+            "df": pd_encode(df),
+            "args": args,
         }
         pred_df = self._run_command(params)
         return pd_decode(pred_df)
     def finetune(self, df, model_state, args):
         params = {
-            'method': BYOM_METHOD.FINETUNE.value,
-            'code': self.code,
-            'model_state': model_state,
-            'df': pd_encode(df),
-            'args': args,
+            "method": BYOM_METHOD.FINETUNE.value,
+            "code": self.code,
+            "model_state": model_state,
+            "df": pd_encode(df),
+            "args": args,
         }
         model_state = self._run_command(params)
@@ -658,10 +641,10 @@ class ModelWrapperSafe:
     def describe(self, model_state, attribute: Optional[str] = None) -> pd.DataFrame:
         params = {
-            'method': BYOM_METHOD.DESCRIBE.value,
-            'code': self.code,
-            'model_state': model_state,
-            'attribute': attribute
+            "method": BYOM_METHOD.DESCRIBE.value,
+            "code": self.code,
+            "model_state": model_state,
+            "attribute": attribute,
         }
         enc_df = self._run_command(params)
         df = pd_decode(enc_df)
@@ -669,10 +652,10 @@ class ModelWrapperSafe:
     def func_call(self, func_name, args):
         params = {
-            'method': BYOM_METHOD.FUNC_CALL.value,
-            'code': self.code,
-            'func_name': func_name,
-            'args': args,
+            "method": BYOM_METHOD.FUNC_CALL.value,
+            "code": self.code,
+            "func_name": func_name,
+            "args": args,
         }
         result = self._run_command(params)
         return result

MindsDB 25.9.2.0a1__py3-none-any.whl → 25.9.3rc1__py3-none-any.whl

Potentially problematic release.

MindsDB 25.9.2.0a1py3-none-any.whl → 25.9.3rc1py3-none-any.whl