PyPI - MindsDB - Versions diffs - 25.1.2.1__py3-none-any.whl → 25.1.4.0__py3-none-any.whl - Mend

MindsDB 25.1.2.1py3-none-any.whl → 25.1.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of MindsDB might be problematic. Click here for more details.

Files changed (77) hide show

{MindsDB-25.1.2.1.dist-info → MindsDB-25.1.4.0.dist-info}/METADATA +244 -242
{MindsDB-25.1.2.1.dist-info → MindsDB-25.1.4.0.dist-info}/RECORD +76 -67
mindsdb/__about__.py +1 -1
mindsdb/__main__.py +5 -3
mindsdb/api/executor/__init__.py +0 -1
mindsdb/api/executor/command_executor.py +2 -1
mindsdb/api/executor/data_types/answer.py +1 -1
mindsdb/api/executor/datahub/datanodes/integration_datanode.py +7 -2
mindsdb/api/executor/datahub/datanodes/project_datanode.py +8 -1
mindsdb/api/executor/sql_query/__init__.py +1 -0
mindsdb/api/executor/sql_query/result_set.py +36 -21
mindsdb/api/executor/sql_query/steps/apply_predictor_step.py +1 -1
mindsdb/api/executor/sql_query/steps/join_step.py +4 -4
mindsdb/api/executor/sql_query/steps/map_reduce_step.py +6 -39
mindsdb/api/executor/utilities/sql.py +2 -10
mindsdb/api/http/namespaces/knowledge_bases.py +3 -3
mindsdb/api/http/namespaces/sql.py +3 -1
mindsdb/api/mysql/mysql_proxy/executor/mysql_executor.py +2 -1
mindsdb/api/mysql/mysql_proxy/mysql_proxy.py +7 -0
mindsdb/api/postgres/postgres_proxy/executor/executor.py +2 -1
mindsdb/integrations/handlers/chromadb_handler/chromadb_handler.py +2 -2
mindsdb/integrations/handlers/chromadb_handler/requirements.txt +1 -1
mindsdb/integrations/handlers/file_handler/file_handler.py +1 -1
mindsdb/integrations/handlers/file_handler/tests/test_file_handler.py +17 -1
mindsdb/integrations/handlers/jira_handler/jira_handler.py +15 -1
mindsdb/integrations/handlers/jira_handler/jira_table.py +52 -31
mindsdb/integrations/handlers/langchain_embedding_handler/fastapi_embeddings.py +82 -0
mindsdb/integrations/handlers/langchain_embedding_handler/langchain_embedding_handler.py +8 -1
mindsdb/integrations/handlers/langchain_handler/requirements.txt +1 -1
mindsdb/integrations/handlers/pgvector_handler/pgvector_handler.py +48 -16
mindsdb/integrations/handlers/pinecone_handler/pinecone_handler.py +123 -72
mindsdb/integrations/handlers/pinecone_handler/requirements.txt +1 -1
mindsdb/integrations/handlers/postgres_handler/postgres_handler.py +12 -6
mindsdb/integrations/handlers/slack_handler/slack_handler.py +13 -2
mindsdb/integrations/handlers/slack_handler/slack_tables.py +21 -1
mindsdb/integrations/libs/ml_handler_process/learn_process.py +1 -1
mindsdb/integrations/utilities/rag/loaders/vector_store_loader/pgvector.py +76 -27
mindsdb/integrations/utilities/rag/loaders/vector_store_loader/vector_store_loader.py +18 -1
mindsdb/integrations/utilities/rag/pipelines/rag.py +73 -18
mindsdb/integrations/utilities/rag/rerankers/reranker_compressor.py +166 -108
mindsdb/integrations/utilities/rag/retrievers/sql_retriever.py +36 -14
mindsdb/integrations/utilities/rag/settings.py +8 -2
mindsdb/integrations/utilities/sql_utils.py +1 -1
mindsdb/interfaces/agents/agents_controller.py +3 -5
mindsdb/interfaces/agents/langchain_agent.py +112 -150
mindsdb/interfaces/agents/langfuse_callback_handler.py +0 -37
mindsdb/interfaces/agents/mindsdb_database_agent.py +15 -13
mindsdb/interfaces/chatbot/chatbot_controller.py +7 -11
mindsdb/interfaces/chatbot/chatbot_task.py +16 -5
mindsdb/interfaces/chatbot/memory.py +58 -13
mindsdb/interfaces/database/projects.py +17 -15
mindsdb/interfaces/database/views.py +12 -25
mindsdb/interfaces/knowledge_base/controller.py +39 -15
mindsdb/interfaces/model/functions.py +15 -4
mindsdb/interfaces/model/model_controller.py +4 -7
mindsdb/interfaces/skills/custom/text2sql/mindsdb_sql_toolkit.py +47 -38
mindsdb/interfaces/skills/retrieval_tool.py +10 -3
mindsdb/interfaces/skills/skill_tool.py +97 -53
mindsdb/interfaces/skills/sql_agent.py +77 -36
mindsdb/interfaces/storage/db.py +1 -1
mindsdb/migrations/versions/2025-01-15_c06c35f7e8e1_project_company.py +88 -0
mindsdb/utilities/cache.py +7 -4
mindsdb/utilities/context.py +11 -1
mindsdb/utilities/langfuse.py +264 -0
mindsdb/utilities/log.py +20 -2
mindsdb/utilities/otel/__init__.py +206 -0
mindsdb/utilities/otel/logger.py +25 -0
mindsdb/utilities/otel/meter.py +19 -0
mindsdb/utilities/otel/metric_handlers/__init__.py +25 -0
mindsdb/utilities/otel/tracer.py +16 -0
mindsdb/utilities/partitioning.py +52 -0
mindsdb/utilities/render/sqlalchemy_render.py +7 -1
mindsdb/utilities/utils.py +34 -0
mindsdb/utilities/otel.py +0 -72
{MindsDB-25.1.2.1.dist-info → MindsDB-25.1.4.0.dist-info}/LICENSE +0 -0
{MindsDB-25.1.2.1.dist-info → MindsDB-25.1.4.0.dist-info}/WHEEL +0 -0
{MindsDB-25.1.2.1.dist-info → MindsDB-25.1.4.0.dist-info}/top_level.txt +0 -0

mindsdb/integrations/utilities/rag/retrievers/sql_retriever.py CHANGED Viewed

@@ -136,7 +136,7 @@ Output:
         )
         retry_chain = LLMChain(llm=self.llm, prompt=retry_prompt)
         # Generate rewritten query.
-        return retry_chain.predict(
+        sql_query = retry_chain.predict(
             query=query,
             dialect='postgres',
             error=error,
@@ -144,6 +144,16 @@ Output:
             schema=schema,
             callbacks=run_manager.get_child() if run_manager else None
         )
+        query_checker_prompt = PromptTemplate(
+            input_variables=['dialect', 'query'],
+            template=self.query_checker_template
+        )
+        query_checker_chain = LLMChain(llm=self.llm, prompt=query_checker_prompt)
+        # Check the query & return the final result to be executed.
+        return query_checker_chain.predict(
+            dialect='postgres',
+            query=sql_query
+        )
     def _get_relevant_documents(
         self, query: str, *, run_manager: CallbackManagerForRetrieverRun
@@ -163,20 +173,28 @@ Output:
         # Actually execute the similarity search with metadata filters.
         document_response = self.vector_store_handler.native_query(checked_sql_query_with_embeddings)
         num_retries = 0
-        while document_response.resp_type == RESPONSE_TYPE.ERROR:
-            error_msg = document_response.error_message
-            # LLMs won't always generate a working SQL query so we should have a fallback after retrying.
-            logger.info(f'SQL Retriever query {checked_sql_query} failed with error {error_msg}')
-            if num_retries >= self.num_retries:
-                logger.info('Using fallback retriever in SQL retriever.')
-                return self.fallback_retriever._get_relevant_documents(retrieval_query, run_manager)
-            query_to_retry = self._prepare_retry_query(checked_sql_query, error_msg, run_manager)
-            query_to_retry_with_embeddings = query_to_retry.format(embeddings=str(embedded_query))
+        while num_retries < self.num_retries:
+            if document_response.resp_type == RESPONSE_TYPE.ERROR:
+                error_msg = document_response.error_message
+                # LLMs won't always generate a working SQL query so we should have a fallback after retrying.
+                logger.info(f'SQL Retriever query {checked_sql_query} failed with error {error_msg}')
+                checked_sql_query = self._prepare_retry_query(checked_sql_query, error_msg, run_manager)
+            elif len(document_response.data_frame) == 0:
+                error_msg = "No documents retrieved from query."
+                checked_sql_query = self._prepare_retry_query(checked_sql_query, error_msg, run_manager)
+            else:
+                break
+            checked_sql_query_with_embeddings = checked_sql_query.format(embeddings=str(embedded_query))
             # Handle LLM output that has the ```sql delimiter possibly.
-            query_to_retry_with_embeddings = query_to_retry_with_embeddings.replace('```sql', '')
-            query_to_retry_with_embeddings = query_to_retry_with_embeddings.replace('```', '')
-            document_response = self.vector_store_handler.native_query(query_to_retry_with_embeddings)
+            checked_sql_query_with_embeddings = checked_sql_query_with_embeddings.replace('```sql', '')
+            checked_sql_query_with_embeddings = checked_sql_query_with_embeddings.replace('```', '')
+            document_response = self.vector_store_handler.native_query(checked_sql_query_with_embeddings)
             num_retries += 1
+            if num_retries >= self.num_retries:
+                logger.info('Using fallback retriever in SQL retriever.')
+                return self.fallback_retriever._get_relevant_documents(retrieval_query, run_manager=run_manager)
         document_df = document_response.data_frame
         retrieved_documents = []
@@ -185,4 +203,8 @@ Output:
                 document_row.get('content', ''),
                 metadata=document_row.get('metadata', {})
             ))
-        return retrieved_documents
+        if retrieved_documents:
+            return retrieved_documents
+        # If the SQL query constructed did not return any documents, fallback.
+        logger.info('No documents returned from SQL retriever. using fallback retriever.')
+        return self.fallback_retriever._get_relevant_documents(retrieval_query, run_manager=run_manager)

mindsdb/integrations/utilities/rag/settings.py CHANGED Viewed

@@ -136,7 +136,6 @@ Columns:
         "description": "Metadata for the document chunk. Always select metadata and always join with the {source_table} table on the string metadata field 'original_row_id'"
     }}
 }}
-```
 {schema}
@@ -290,6 +289,8 @@ class VectorStoreConfig(BaseModel):
     collection_name: str = DEFAULT_COLLECTION_NAME
     connection_string: str = None
     kb_table: Any = None
+    is_sparse: bool = False
+    vector_size: Optional[int] = None
     class Config:
         arbitrary_types_allowed = True
@@ -449,8 +450,13 @@ class SummarizationConfig(BaseModel):
 class RerankerConfig(BaseModel):
     model: str = DEFAULT_RERANKING_MODEL
     base_url: str = DEFAULT_LLM_ENDPOINT
-    filtering_threshold: float = 0.99
+    filtering_threshold: float = 0.5
     num_docs_to_keep: Optional[int] = None
+    max_concurrent_requests: int = 20
+    max_retries: int = 3
+    retry_delay: float = 1.0
+    early_stop: bool = True  # Whether to enable early stopping
+    early_stop_threshold: float = 0.8  # Confidence threshold for early stopping
 class MultiHopRetrieverConfig(BaseModel):

mindsdb/integrations/utilities/sql_utils.py CHANGED Viewed

@@ -178,7 +178,7 @@ def project_dataframe(df, targets, table_columns):
     # adapt column names to projection
     if len(df_col_rename) > 0:
-        df = df.rename(columns=df_col_rename)
+        df.rename(columns=df_col_rename, inplace=True)
     return df

mindsdb/interfaces/agents/agents_controller.py CHANGED Viewed

@@ -362,24 +362,22 @@ class AgentsController:
             project_name: str = 'mindsdb',
             tools: List[BaseTool] = None,
             stream: bool = False) -> Union[Iterator[object], pd.DataFrame]:
-        '''
+        """
         Queries an agent to get a completion.
         Parameters:
             agent (db.Agents): Existing agent to get completion from
             messages (List[Dict[str, str]]): Chat history to send to the agent
-            trace_id (str): ID of Langfuse trace to use
-            observation_id (str): ID of parent Langfuse observation to use
             project_name (str): Project the agent belongs to (default mindsdb)
             tools (List[BaseTool]): Tools to use while getting the completion
-            stream (bool): Whether or not to stream the response
+            stream (bool): Whether to stream the response
         Returns:
             response (Union[Iterator[object], pd.DataFrame]): Completion as a DataFrame or iterator of completion chunks
         Raises:
             ValueError: Agent's model does not exist.
-        '''
+        """
         if stream:
             return self._get_completion_stream(
                 agent,

mindsdb/interfaces/agents/langchain_agent.py CHANGED Viewed

@@ -1,8 +1,7 @@
 import json
 from concurrent.futures import as_completed, TimeoutError
-from typing import Dict, Iterable, List
+from typing import Dict, Iterable, List, Optional
 from uuid import uuid4
-import os
 import re
 import numpy as np
 import pandas as pd
@@ -20,9 +19,6 @@ from langchain_nvidia_ai_endpoints import ChatNVIDIA
 from langchain_core.messages.base import BaseMessage
 from langchain_core.prompts import PromptTemplate
 from langchain_core.tools import Tool
-from langfuse import Langfuse
-from langfuse.api.resources.commons.errors.not_found_error import NotFoundError as TraceNotFoundError
-from langfuse.callback import CallbackHandler
 from mindsdb.integrations.handlers.openai_handler.constants import (
     CHAT_MODELS as OPEN_AI_CHAT_MODELS,
@@ -35,13 +31,11 @@ from mindsdb.utilities.context_executor import ContextThreadPoolExecutor
 from mindsdb.interfaces.storage import db
 from mindsdb.utilities.context import context as ctx
 from .mindsdb_chat_model import ChatMindsdb
 from .callback_handlers import LogCallbackHandler, ContextCaptureCallback
-from .langfuse_callback_handler import LangfuseCallbackHandler, get_metadata, get_tags, get_tool_usage, get_skills
+from .langfuse_callback_handler import LangfuseCallbackHandler, get_skills
 from .safe_output_parser import SafeOutputParser
 from .constants import (
     DEFAULT_AGENT_TIMEOUT_SECONDS,
     DEFAULT_AGENT_TYPE,
@@ -62,6 +56,8 @@ from langchain_anthropic import ChatAnthropic
 from langchain_core.messages import SystemMessage
 from langchain_openai import ChatOpenAI
+from mindsdb.utilities.langfuse import LangfuseClientWrapper
 _PARSING_ERROR_PREFIXES = [
     "An output parsing error occurred",
     "Could not parse LLM output",
@@ -207,34 +203,42 @@ def process_chunk(chunk):
 class LangchainAgent:
     def __init__(self, agent: db.Agents, model: dict = None):
         self.agent = agent
         self.model = model
-        self.llm = None
-        self.embedding_model = None
-        args = agent.params.copy()
-        args["model_name"] = agent.model_name
-        args["provider"] = agent.provider
+        self.run_completion_span: Optional[object] = None
+        self.llm: Optional[object] = None
+        self.embedding_model: Optional[object] = None
+        self.log_callback_handler: Optional[object] = None
+        self.langfuse_callback_handler: Optional[object] = None  # native langfuse callback handler
+        self.mdb_langfuse_callback_handler: Optional[object] = None  # custom (see langfuse_callback_handler.py)
+        self.langfuse_client_wrapper = LangfuseClientWrapper()
+        self.args = self._initialize_args()
+        # Back compatibility for old models
+        self.provider = self.args.get("provider", get_llm_provider(self.args))
+    def _initialize_args(self) -> dict:
+        """Initialize the arguments based on the agent's parameters."""
+        args = self.agent.params.copy()
+        args["model_name"] = self.agent.model_name
+        args["provider"] = self.agent.provider
         args["embedding_model_provider"] = args.get(
             "embedding_model", get_embedding_model_provider(args)
         )
-        self.langfuse = None
-        if os.getenv('LANGFUSE_PUBLIC_KEY') is not None:
-            self.langfuse = Langfuse(
-                public_key=os.getenv('LANGFUSE_PUBLIC_KEY'),
-                secret_key=os.getenv('LANGFUSE_SECRET_KEY'),
-                host=os.getenv('LANGFUSE_HOST'),
-                release=os.getenv('LANGFUSE_RELEASE', 'local'),
-            )
         # agent is using current langchain model
-        if agent.provider == "mindsdb":
-            args["model_name"] = agent.model_name
+        if self.agent.provider == "mindsdb":
+            args["model_name"] = self.agent.model_name
             # get prompt
             prompt_template = (
-                model["problem_definition"].get("using", {}).get("prompt_template")
+                self.model["problem_definition"].get("using", {}).get("prompt_template")
             )
             if prompt_template is not None:
                 # only update prompt_template if it is set on the model
@@ -248,57 +252,47 @@ class LangchainAgent:
                     "Please provide a `prompt_template` or set `mode=retrieval`"
                 )
-        self.args = args
-        self.trace_id = None
-        self.observation_id = None
-        self.log_callback_handler = None
-        self.langfuse_callback_handler = None  # native langfuse callback handler
-        self.mdb_langfuse_callback_handler = (
-            None  # custom (see langfuse_callback_handler.py)
-        )
+        return args
+    def get_metadata(self) -> Dict:
+        return {
+            'provider': self.provider,
+            'model_name': self.args["model_name"],
+            'embedding_model_provider': self.args.get('embedding_model_provider',
+                                                      get_embedding_model_provider(self.args)),
+            'skills': get_skills(self.agent),
+            'user_id': ctx.user_id,
+            'session_id': ctx.session_id,
+            'company_id': ctx.company_id,
+            'user_class': ctx.user_class,
+            'email_confirmed': ctx.email_confirmed
+        }
+    def get_tags(self) -> List:
+        return [
+            self.provider,
+        ]
     def get_completion(self, messages, stream: bool = False):
-        self.run_completion_span = None
-        self.api_trace = None
-        if self.langfuse:
-            # todo we need to fix this as this assumes that the model is always langchain
-            # since decoupling the model from langchain, we need to find a way to get the model name
-            # this breaks retrieval agents
-            # metadata retrieval
-            trace_metadata = {
-                'provider': self.args["provider"],
-                'model_name': self.args["model_name"],
-                'embedding_model_provider': self.args.get('embedding_model_provider', get_embedding_model_provider(self.args))
-            }
-            trace_metadata['skills'] = get_skills(self.agent)
-            trace_tags = get_tags(trace_metadata)
-            # Set our user info to pass into langfuse trace, with fault tolerance in each individual one just incase on purpose
-            trace_metadata['user_id'] = ctx.user_id
-            trace_metadata['session_id'] = ctx.session_id
-            trace_metadata['company_id'] = ctx.company_id
-            trace_metadata['user_class'] = ctx.user_class
-            trace_metadata['email_confirmed'] = ctx.email_confirmed
-            self.api_trace = self.langfuse.trace(
-                name='api-completion',
-                input=messages,
-                tags=trace_tags,
-                metadata=trace_metadata,
-                user_id=ctx.user_id,
-                session_id=ctx.session_id,
-            )
-            self.run_completion_span = self.api_trace.span(name='run-completion', input=messages)
-            trace_id = self.api_trace.id
-            observation_id = self.run_completion_span.id
+        # Get metadata and tags to be used in the trace
+        metadata = self.get_metadata()
+        tags = self.get_tags()
+        # Set up trace for the API completion in Langfuse
+        self.langfuse_client_wrapper.setup_trace(
+            name='api-completion',
+            input=messages,
+            tags=tags,
+            metadata=metadata,
+            user_id=ctx.user_id,
+            session_id=ctx.session_id,
+        )
-            self.trace_id = trace_id
-            self.observation_id = observation_id
-            logger.info(f"Langfuse trace created with ID: {trace_id}")
+        # Set up trace for the run completion in Langfuse
+        self.run_completion_span = self.langfuse_client_wrapper.start_span(
+            name='run-completion',
+            input=messages)
         if stream:
             return self._get_completion_stream(messages)
@@ -317,21 +311,8 @@ class LangchainAgent:
         df.iloc[:-1, df.columns.get_loc(user_column)] = None
         response = self.run_agent(df, agent, args)
-        if self.run_completion_span is not None and self.api_trace is not None:
-            self.run_completion_span.end(output=response)
-            self.api_trace.update(output=response)
-            # update metadata with tool usage
-            try:
-                # Ensure all batched traces are sent before fetching.
-                self.langfuse.flush()
-                trace = self.langfuse.get_trace(self.trace_id)
-                trace_metadata['tool_usage'] = get_tool_usage(trace)
-                self.api_trace.update(metadata=trace_metadata)
-            except TraceNotFoundError:
-                logger.warning(f'Langfuse trace {self.trace_id} not found')
-            except Exception as e:
-                logger.error(f'Something went wrong while processing Langfuse trace {self.trace_id}: {str(e)}')
+        # End the run completion span and update the metadata with tool usage
+        self.langfuse_client_wrapper.end_span(span=self.run_completion_span, output=response)
         return response
@@ -349,6 +330,7 @@ class LangchainAgent:
         df = pd.DataFrame(messages)
+        self.embedding_model_provider = args.get('embedding_model_provider', get_embedding_model_provider(args))
         # Back compatibility for old models
         self.provider = args.get("provider", get_llm_provider(args))
@@ -445,69 +427,49 @@ class LangchainAgent:
         return all_tools
     def _get_agent_callbacks(self, args: Dict) -> List:
+        all_callbacks = []
         if self.log_callback_handler is None:
             self.log_callback_handler = LogCallbackHandler(logger)
-        all_callbacks = [self.log_callback_handler]
+        all_callbacks.append(self.log_callback_handler)
-        langfuse_public_key = args.get(
-            "langfuse_public_key", os.getenv("LANGFUSE_PUBLIC_KEY")
-        )
-        langfuse_secret_key = args.get(
-            "langfuse_secret_key", os.getenv("LANGFUSE_SECRET_KEY")
-        )
-        langfuse_host = args.get("langfuse_host", os.getenv("LANGFUSE_HOST"))
-        are_langfuse_args_present = (
-            bool(langfuse_public_key)
-            and bool(langfuse_secret_key)
-            and bool(langfuse_host)
-        )
+        if self.langfuse_client_wrapper.trace is None:
+            # Get metadata and tags to be used in the trace
+            metadata = self.get_metadata()
+            tags = self.get_tags()
-        if are_langfuse_args_present:
-            if self.langfuse_callback_handler is None:
-                trace_name = args.get(
-                    "trace_id",
-                    (
-                        f"NativeTrace-...{self.trace_id[-7:]}"
-                        if self.trace_id is not None
-                        else "NativeTrace-MindsDB-AgentExecutor"
-                    ),
-                )
-                metadata = get_metadata(args)
-                self.langfuse_callback_handler = CallbackHandler(
-                    public_key=langfuse_public_key,
-                    secret_key=langfuse_secret_key,
-                    host=langfuse_host,
-                    trace_name=trace_name,
-                    tags=get_tags(metadata),
-                    metadata=metadata,
-                )
-                try:
-                    # This try is critical to catch fatal errors which would otherwise prevent the agent from running properly
-                    if not self.langfuse_callback_handler.auth_check():
-                        logger.error(
-                            f"Incorrect Langfuse credentials provided to Langchain handler. Full args: {args}"
-                        )
-                except Exception as e:
-                    logger.error(f'Something went wrong while running langfuse_callback_handler.auth_check {str(e)}')
-            # custom tracer
-            if self.mdb_langfuse_callback_handler is None:
-                trace_id = args.get("trace_id", self.trace_id or None)
-                observation_id = args.get(
-                    "observation_id", self.observation_id or uuid4().hex
-                )
-                langfuse = Langfuse(
-                    host=langfuse_host,
-                    public_key=langfuse_public_key,
-                    secret_key=langfuse_secret_key,
-                )
-                self.mdb_langfuse_callback_handler = LangfuseCallbackHandler(
-                    langfuse=langfuse,
-                    trace_id=trace_id,
-                    observation_id=observation_id,
-                )
+            trace_name = "NativeTrace-MindsDB-AgentExecutor"
+            # Set up trace for the API completion in Langfuse
+            self.langfuse_client_wrapper.setup_trace(
+                name=trace_name,
+                tags=tags,
+                metadata=metadata,
+                user_id=ctx.user_id,
+                session_id=ctx.session_id,
+            )
+        if self.langfuse_callback_handler is None:
+            self.langfuse_callback_handler = self.langfuse_client_wrapper.get_langchain_handler()
+        # custom tracer
+        if self.mdb_langfuse_callback_handler is None:
+            trace_id = None
+            if self.langfuse_client_wrapper.trace is not None:
+                trace_id = args.get("trace_id", self.langfuse_client_wrapper.trace.id)
+            span_id = None
+            if self.run_completion_span is not None:
+                span_id = self.run_completion_span.id
+            observation_id = args.get("observation_id", span_id or uuid4().hex)
+            self.mdb_langfuse_callback_handler = LangfuseCallbackHandler(
+                langfuse=self.langfuse_client_wrapper.client,
+                trace_id=trace_id,
+                observation_id=observation_id,
+            )
         # obs: we may want to unify these; native langfuse handler provides details as a tree on a sub-step of the overarching custom one  # noqa
         if self.langfuse_callback_handler is not None:
@@ -542,7 +504,8 @@ AI: {response}"""
         return_context = args.get('return_context', True)
         input_variables = re.findall(r"{{(.*?)}}", base_template)
-        prompts, empty_prompt_ids = prepare_prompts(df, base_template, input_variables, args.get('user_column', USER_COLUMN))
+        prompts, empty_prompt_ids = prepare_prompts(df, base_template, input_variables,
+                                                    args.get('user_column', USER_COLUMN))
         def _invoke_agent_executor_with_prompt(agent_executor, prompt):
             if not prompt:
@@ -621,7 +584,8 @@ AI: {response}"""
         if not hasattr(agent_executor, 'stream') or not callable(agent_executor.stream):
             raise AttributeError("The agent_executor does not have a 'stream' method")
-        stream_iterator = agent_executor.stream(prompts[0], config={'callbacks': callbacks})
+        stream_iterator = agent_executor.stream(prompts[0],
+                                                config={'callbacks': callbacks})
         if not hasattr(stream_iterator, '__iter__'):
             raise TypeError("The stream method did not return an iterable")
@@ -642,10 +606,8 @@ AI: {response}"""
             # Yield generated SQL if available
             yield {"type": "sql", "content": self.log_callback_handler.generated_sql}
-        if self.run_completion_span is not None:
-            self.run_completion_span.end()
-            self.api_trace.update()
-            logger.info("Langfuse trace updated")
+        # End the run completion span and update the metadata with tool usage
+        self.langfuse_client_wrapper.end_span_stream(span=self.run_completion_span)
     @staticmethod
     def process_chunk(chunk):

mindsdb/interfaces/agents/langfuse_callback_handler.py CHANGED Viewed

@@ -1,7 +1,6 @@
 from typing import Any, Dict, Union, Optional, List
 from uuid import uuid4
 import datetime
-import os
 from langchain_core.callbacks.base import BaseCallbackHandler
@@ -122,42 +121,6 @@ class LangfuseCallbackHandler(BaseCallbackHandler):
         return False
-def get_metadata(model_using: Dict) -> Dict:
-    """ Generates initial metadata mapping from information provided in a model's `using` clause.
-    Includes providers and model name.
-    """
-    metadata_keys = ['provider', 'model_name', 'embedding_model_provider']  # keeps keys relevant for tracing
-    trace_metadata = {}
-    for key in metadata_keys:
-        if key in model_using:
-            trace_metadata[key] = model_using.get(key)
-    return trace_metadata
 def get_skills(agent: db.Agents) -> List:
     """ Retrieve skills from agent `skills` attribute. Specific to agent endpoints. """
     return [rel.skill.type for rel in agent.skills_relationships]
-def get_tags(metadata: Dict) -> List:
-    """ Retrieves tags from existing langfuse metadata (built using `get_metadata` and `get_skills`), and environment variables. """
-    trace_tags = []
-    if os.getenv('FLASK_ENV'):
-        trace_tags.append(os.getenv('FLASK_ENV'))  # Fix: use something other than flask_env
-    if 'provider' in metadata:
-        trace_tags.append(metadata['provider'])
-    return trace_tags
-def get_tool_usage(trace) -> Dict:
-    """ Retrieves tool usage information from a langfuse trace.
-    Note: assumes trace marks an action with string `AgentAction` """
-    tool_usage = {}
-    steps = [s.name for s in trace.observations]
-    for step in steps:
-        if 'AgentAction' in step:
-            tool_name = step.split('-')[1]
-            if tool_name not in tool_usage:
-                tool_usage[tool_name] = 0
-            tool_usage[tool_name] += 1
-    return tool_usage

mindsdb/interfaces/agents/mindsdb_database_agent.py CHANGED Viewed

@@ -4,36 +4,38 @@
 """
 from typing import Any, Iterable, List, Optional
-from mindsdb.interfaces.skills.skill_tool import skill_tool
 from mindsdb.utilities import log
 from langchain_community.utilities import SQLDatabase
+from mindsdb.interfaces.skills.sql_agent import SQLAgent
 logger = log.getLogger(__name__)
 class MindsDBSQL(SQLDatabase):
+    @staticmethod
+    def custom_init(
+        sql_agent: 'SQLAgent'
+    ) -> 'MindsDBSQL':
+        instance = MindsDBSQL()
+        instance._sql_agent = sql_agent
+        return instance
     """ Can't modify signature, as LangChain does a Pydantic check."""
     def __init__(
         self,
-        engine=None,
-        database: Optional[str] = 'mindsdb',
+        engine: Optional[Any] = None,
+        schema: Optional[str] = None,
         metadata: Optional[Any] = None,
         ignore_tables: Optional[List[str]] = None,
         include_tables: Optional[List[str]] = None,
         sample_rows_in_table_info: int = 3,
-        schema: Optional[str] = None,
         indexes_in_table_info: bool = False,
         custom_table_info: Optional[dict] = None,
-        view_support: Optional[bool] = True,
+        view_support: bool = True,
+        max_string_length: int = 300,
+        lazy_table_reflection: bool = False,
     ):
-        # Some args above are not used in this class, but are kept for compatibility
-        self._sql_agent = skill_tool.get_sql_agent(
-            database,
-            include_tables,
-            ignore_tables,
-            sample_rows_in_table_info
-        )
+        pass
     @property
     def dialect(self) -> str:

mindsdb/interfaces/chatbot/chatbot_controller.py CHANGED Viewed

@@ -4,6 +4,7 @@ from mindsdb.interfaces.agents.agents_controller import AgentsController
 from mindsdb.interfaces.chatbot.chatbot_task import ChatBotTask
 from mindsdb.interfaces.database.projects import ProjectController
 from mindsdb.interfaces.storage import db
+from mindsdb.interfaces.model.functions import get_project_records
 from mindsdb.utilities.context import context as ctx
@@ -128,16 +129,11 @@ class ChatBotController:
             all_bots (List[db.ChatBots]): List of database chatbot object
         '''
-        query = db.session.query(db.Project).filter_by(
-            company_id=ctx.company_id,
-            deleted_at=None
-        )
-        if project_name is not None:
-            query = query.filter_by(name=project_name)
-        project_names = {
-            i.id: i.name
-            for i in query
-        }
+        project_names = {}
+        for project in get_project_records():
+            if project_name is not None and project.name != project_name:
+                continue
+            project_names[project.id] = project.name
         query = db.session.query(
             db.ChatBots, db.Tasks
@@ -228,9 +224,9 @@ class ChatBotController:
             raise ValueError('Need to provide either "model_name" or "agent_name" when creating a chatbot')
         if agent_name is not None:
             agent = self.agents_controller.get_agent(agent_name, project_name)
-            model_name = agent.model_name
             if agent is None:
                 raise ValueError(f"Agent with name doesn't exist: {agent_name}")
+            model_name = agent.model_name
             agent_id = agent.id
         else:
             # Create a new agent with the given model name.

MindsDB 25.1.2.1__py3-none-any.whl → 25.1.4.0__py3-none-any.whl

Potentially problematic release.

MindsDB 25.1.2.1py3-none-any.whl → 25.1.4.0py3-none-any.whl