PyPI - vanna - Versions diffs - 0.7.9__py3-none-any.whl → 2.0.0rc1__py3-none-any.whl - Mend

vanna 0.7.9py3-none-any.whl → 2.0.0rc1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (302) hide show

vanna/__init__.py +167 -395
vanna/agents/__init__.py +7 -0
vanna/capabilities/__init__.py +17 -0
vanna/capabilities/agent_memory/__init__.py +21 -0
vanna/capabilities/agent_memory/base.py +103 -0
vanna/capabilities/agent_memory/models.py +53 -0
vanna/capabilities/file_system/__init__.py +14 -0
vanna/capabilities/file_system/base.py +71 -0
vanna/capabilities/file_system/models.py +25 -0
vanna/capabilities/sql_runner/__init__.py +13 -0
vanna/capabilities/sql_runner/base.py +37 -0
vanna/capabilities/sql_runner/models.py +13 -0
vanna/components/__init__.py +92 -0
vanna/components/base.py +11 -0
vanna/components/rich/__init__.py +83 -0
vanna/components/rich/containers/__init__.py +7 -0
vanna/components/rich/containers/card.py +20 -0
vanna/components/rich/data/__init__.py +9 -0
vanna/components/rich/data/chart.py +17 -0
vanna/components/rich/data/dataframe.py +93 -0
vanna/components/rich/feedback/__init__.py +21 -0
vanna/components/rich/feedback/badge.py +16 -0
vanna/components/rich/feedback/icon_text.py +14 -0
vanna/components/rich/feedback/log_viewer.py +41 -0
vanna/components/rich/feedback/notification.py +19 -0
vanna/components/rich/feedback/progress.py +37 -0
vanna/components/rich/feedback/status_card.py +28 -0
vanna/components/rich/feedback/status_indicator.py +14 -0
vanna/components/rich/interactive/__init__.py +21 -0
vanna/components/rich/interactive/button.py +95 -0
vanna/components/rich/interactive/task_list.py +58 -0
vanna/components/rich/interactive/ui_state.py +93 -0
vanna/components/rich/specialized/__init__.py +7 -0
vanna/components/rich/specialized/artifact.py +20 -0
vanna/components/rich/text.py +16 -0
vanna/components/simple/__init__.py +15 -0
vanna/components/simple/image.py +15 -0
vanna/components/simple/link.py +15 -0
vanna/components/simple/text.py +11 -0
vanna/core/__init__.py +193 -0
vanna/core/_compat.py +19 -0
vanna/core/agent/__init__.py +10 -0
vanna/core/agent/agent.py +1407 -0
vanna/core/agent/config.py +123 -0
vanna/core/audit/__init__.py +28 -0
vanna/core/audit/base.py +299 -0
vanna/core/audit/models.py +131 -0
vanna/core/component_manager.py +329 -0
vanna/core/components.py +53 -0
vanna/core/enhancer/__init__.py +11 -0
vanna/core/enhancer/base.py +94 -0
vanna/core/enhancer/default.py +118 -0
vanna/core/enricher/__init__.py +10 -0
vanna/core/enricher/base.py +59 -0
vanna/core/errors.py +47 -0
vanna/core/evaluation/__init__.py +81 -0
vanna/core/evaluation/base.py +186 -0
vanna/core/evaluation/dataset.py +254 -0
vanna/core/evaluation/evaluators.py +376 -0
vanna/core/evaluation/report.py +289 -0
vanna/core/evaluation/runner.py +313 -0
vanna/core/filter/__init__.py +10 -0
vanna/core/filter/base.py +67 -0
vanna/core/lifecycle/__init__.py +10 -0
vanna/core/lifecycle/base.py +83 -0
vanna/core/llm/__init__.py +16 -0
vanna/core/llm/base.py +40 -0
vanna/core/llm/models.py +61 -0
vanna/core/middleware/__init__.py +10 -0
vanna/core/middleware/base.py +69 -0
vanna/core/observability/__init__.py +11 -0
vanna/core/observability/base.py +88 -0
vanna/core/observability/models.py +47 -0
vanna/core/recovery/__init__.py +11 -0
vanna/core/recovery/base.py +84 -0
vanna/core/recovery/models.py +32 -0
vanna/core/registry.py +278 -0
vanna/core/rich_component.py +156 -0
vanna/core/simple_component.py +27 -0
vanna/core/storage/__init__.py +14 -0
vanna/core/storage/base.py +46 -0
vanna/core/storage/models.py +46 -0
vanna/core/system_prompt/__init__.py +13 -0
vanna/core/system_prompt/base.py +36 -0
vanna/core/system_prompt/default.py +157 -0
vanna/core/tool/__init__.py +18 -0
vanna/core/tool/base.py +70 -0
vanna/core/tool/models.py +84 -0
vanna/core/user/__init__.py +17 -0
vanna/core/user/base.py +29 -0
vanna/core/user/models.py +25 -0
vanna/core/user/request_context.py +70 -0
vanna/core/user/resolver.py +42 -0
vanna/core/validation.py +164 -0
vanna/core/workflow/__init__.py +12 -0
vanna/core/workflow/base.py +254 -0
vanna/core/workflow/default.py +789 -0
vanna/examples/__init__.py +1 -0
vanna/examples/__main__.py +44 -0
vanna/examples/anthropic_quickstart.py +80 -0
vanna/examples/artifact_example.py +293 -0
vanna/examples/claude_sqlite_example.py +236 -0
vanna/examples/coding_agent_example.py +300 -0
vanna/examples/custom_system_prompt_example.py +174 -0
vanna/examples/default_workflow_handler_example.py +208 -0
vanna/examples/email_auth_example.py +340 -0
vanna/examples/evaluation_example.py +269 -0
vanna/examples/extensibility_example.py +262 -0
vanna/examples/minimal_example.py +67 -0
vanna/examples/mock_auth_example.py +227 -0
vanna/examples/mock_custom_tool.py +311 -0
vanna/examples/mock_quickstart.py +79 -0
vanna/examples/mock_quota_example.py +145 -0
vanna/examples/mock_rich_components_demo.py +396 -0
vanna/examples/mock_sqlite_example.py +223 -0
vanna/examples/openai_quickstart.py +83 -0
vanna/examples/primitive_components_demo.py +305 -0
vanna/examples/quota_lifecycle_example.py +139 -0
vanna/examples/visualization_example.py +251 -0
vanna/integrations/__init__.py +17 -0
vanna/integrations/anthropic/__init__.py +9 -0
vanna/integrations/anthropic/llm.py +270 -0
vanna/integrations/azureopenai/__init__.py +9 -0
vanna/integrations/azureopenai/llm.py +329 -0
vanna/integrations/azuresearch/__init__.py +7 -0
vanna/integrations/azuresearch/agent_memory.py +413 -0
vanna/integrations/bigquery/__init__.py +5 -0
vanna/integrations/bigquery/sql_runner.py +81 -0
vanna/integrations/chromadb/__init__.py +104 -0
vanna/integrations/chromadb/agent_memory.py +416 -0
vanna/integrations/clickhouse/__init__.py +5 -0
vanna/integrations/clickhouse/sql_runner.py +82 -0
vanna/integrations/duckdb/__init__.py +5 -0
vanna/integrations/duckdb/sql_runner.py +65 -0
vanna/integrations/faiss/__init__.py +7 -0
vanna/integrations/faiss/agent_memory.py +431 -0
vanna/integrations/google/__init__.py +9 -0
vanna/integrations/google/gemini.py +370 -0
vanna/integrations/hive/__init__.py +5 -0
vanna/integrations/hive/sql_runner.py +87 -0
vanna/integrations/local/__init__.py +17 -0
vanna/integrations/local/agent_memory/__init__.py +7 -0
vanna/integrations/local/agent_memory/in_memory.py +285 -0
vanna/integrations/local/audit.py +59 -0
vanna/integrations/local/file_system.py +242 -0
vanna/integrations/local/file_system_conversation_store.py +255 -0
vanna/integrations/local/storage.py +62 -0
vanna/integrations/marqo/__init__.py +7 -0
vanna/integrations/marqo/agent_memory.py +354 -0
vanna/integrations/milvus/__init__.py +7 -0
vanna/integrations/milvus/agent_memory.py +458 -0
vanna/integrations/mock/__init__.py +9 -0
vanna/integrations/mock/llm.py +65 -0
vanna/integrations/mssql/__init__.py +5 -0
vanna/integrations/mssql/sql_runner.py +66 -0
vanna/integrations/mysql/__init__.py +5 -0
vanna/integrations/mysql/sql_runner.py +92 -0
vanna/integrations/ollama/__init__.py +7 -0
vanna/integrations/ollama/llm.py +252 -0
vanna/integrations/openai/__init__.py +10 -0
vanna/integrations/openai/llm.py +267 -0
vanna/integrations/openai/responses.py +163 -0
vanna/integrations/opensearch/__init__.py +7 -0
vanna/integrations/opensearch/agent_memory.py +411 -0
vanna/integrations/oracle/__init__.py +5 -0
vanna/integrations/oracle/sql_runner.py +75 -0
vanna/integrations/pinecone/__init__.py +7 -0
vanna/integrations/pinecone/agent_memory.py +329 -0
vanna/integrations/plotly/__init__.py +5 -0
vanna/integrations/plotly/chart_generator.py +313 -0
vanna/integrations/postgres/__init__.py +9 -0
vanna/integrations/postgres/sql_runner.py +112 -0
vanna/integrations/premium/agent_memory/__init__.py +7 -0
vanna/integrations/premium/agent_memory/premium.py +186 -0
vanna/integrations/presto/__init__.py +5 -0
vanna/integrations/presto/sql_runner.py +107 -0
vanna/integrations/qdrant/__init__.py +7 -0
vanna/integrations/qdrant/agent_memory.py +439 -0
vanna/integrations/snowflake/__init__.py +5 -0
vanna/integrations/snowflake/sql_runner.py +147 -0
vanna/integrations/sqlite/__init__.py +9 -0
vanna/integrations/sqlite/sql_runner.py +65 -0
vanna/integrations/weaviate/__init__.py +7 -0
vanna/integrations/weaviate/agent_memory.py +428 -0
vanna/{ZhipuAI → legacy/ZhipuAI}/ZhipuAI_embeddings.py +11 -11
vanna/legacy/__init__.py +403 -0
vanna/legacy/adapter.py +463 -0
vanna/{advanced → legacy/advanced}/__init__.py +3 -1
vanna/{anthropic → legacy/anthropic}/anthropic_chat.py +9 -7
vanna/{azuresearch → legacy/azuresearch}/azuresearch_vector.py +79 -41
vanna/{base → legacy/base}/base.py +224 -217
vanna/legacy/bedrock/__init__.py +1 -0
vanna/{bedrock → legacy/bedrock}/bedrock_converse.py +13 -12
vanna/{chromadb → legacy/chromadb}/chromadb_vector.py +3 -1
vanna/legacy/cohere/__init__.py +2 -0
vanna/{cohere → legacy/cohere}/cohere_chat.py +19 -14
vanna/{cohere → legacy/cohere}/cohere_embeddings.py +25 -19
vanna/{deepseek → legacy/deepseek}/deepseek_chat.py +5 -6
vanna/legacy/faiss/__init__.py +1 -0
vanna/{faiss → legacy/faiss}/faiss.py +113 -59
vanna/{flask → legacy/flask}/__init__.py +84 -43
vanna/{flask → legacy/flask}/assets.py +5 -5
vanna/{flask → legacy/flask}/auth.py +5 -4
vanna/{google → legacy/google}/bigquery_vector.py +75 -42
vanna/{google → legacy/google}/gemini_chat.py +7 -3
vanna/{hf → legacy/hf}/hf.py +0 -1
vanna/{milvus → legacy/milvus}/milvus_vector.py +58 -35
vanna/{mock → legacy/mock}/llm.py +0 -1
vanna/legacy/mock/vectordb.py +67 -0
vanna/legacy/ollama/ollama.py +110 -0
vanna/{openai → legacy/openai}/openai_chat.py +2 -6
vanna/legacy/opensearch/opensearch_vector.py +369 -0
vanna/legacy/opensearch/opensearch_vector_semantic.py +200 -0
vanna/legacy/oracle/oracle_vector.py +584 -0
vanna/{pgvector → legacy/pgvector}/pgvector.py +42 -13
vanna/{qdrant → legacy/qdrant}/qdrant.py +2 -6
vanna/legacy/qianfan/Qianfan_Chat.py +170 -0
vanna/legacy/qianfan/Qianfan_embeddings.py +36 -0
vanna/legacy/qianwen/QianwenAI_chat.py +132 -0
vanna/{remote.py → legacy/remote.py} +28 -26
vanna/{utils.py → legacy/utils.py} +6 -11
vanna/{vannadb → legacy/vannadb}/vannadb_vector.py +115 -46
vanna/{vllm → legacy/vllm}/vllm.py +5 -6
vanna/{weaviate → legacy/weaviate}/weaviate_vector.py +59 -40
vanna/{xinference → legacy/xinference}/xinference.py +6 -6
vanna/py.typed +0 -0
vanna/servers/__init__.py +16 -0
vanna/servers/__main__.py +8 -0
vanna/servers/base/__init__.py +18 -0
vanna/servers/base/chat_handler.py +65 -0
vanna/servers/base/models.py +111 -0
vanna/servers/base/rich_chat_handler.py +141 -0
vanna/servers/base/templates.py +331 -0
vanna/servers/cli/__init__.py +7 -0
vanna/servers/cli/server_runner.py +204 -0
vanna/servers/fastapi/__init__.py +7 -0
vanna/servers/fastapi/app.py +163 -0
vanna/servers/fastapi/routes.py +183 -0
vanna/servers/flask/__init__.py +7 -0
vanna/servers/flask/app.py +132 -0
vanna/servers/flask/routes.py +137 -0
vanna/tools/__init__.py +41 -0
vanna/tools/agent_memory.py +322 -0
vanna/tools/file_system.py +879 -0
vanna/tools/python.py +222 -0
vanna/tools/run_sql.py +165 -0
vanna/tools/visualize_data.py +195 -0
vanna/utils/__init__.py +0 -0
vanna/web_components/__init__.py +44 -0
vanna-2.0.0rc1.dist-info/METADATA +868 -0
vanna-2.0.0rc1.dist-info/RECORD +289 -0
vanna-2.0.0rc1.dist-info/entry_points.txt +3 -0
vanna/bedrock/__init__.py +0 -1
vanna/cohere/__init__.py +0 -2
vanna/faiss/__init__.py +0 -1
vanna/mock/vectordb.py +0 -55
vanna/ollama/ollama.py +0 -103
vanna/opensearch/opensearch_vector.py +0 -392
vanna/opensearch/opensearch_vector_semantic.py +0 -175
vanna/oracle/oracle_vector.py +0 -585
vanna/qianfan/Qianfan_Chat.py +0 -165
vanna/qianfan/Qianfan_embeddings.py +0 -36
vanna/qianwen/QianwenAI_chat.py +0 -133
vanna-0.7.9.dist-info/METADATA +0 -408
vanna-0.7.9.dist-info/RECORD +0 -79
/vanna/{ZhipuAI → legacy/ZhipuAI}/ZhipuAI_Chat.py +0 -0
/vanna/{ZhipuAI → legacy/ZhipuAI}/__init__.py +0 -0
/vanna/{anthropic → legacy/anthropic}/__init__.py +0 -0
/vanna/{azuresearch → legacy/azuresearch}/__init__.py +0 -0
/vanna/{base → legacy/base}/__init__.py +0 -0
/vanna/{chromadb → legacy/chromadb}/__init__.py +0 -0
/vanna/{deepseek → legacy/deepseek}/__init__.py +0 -0
/vanna/{exceptions → legacy/exceptions}/__init__.py +0 -0
/vanna/{google → legacy/google}/__init__.py +0 -0
/vanna/{hf → legacy/hf}/__init__.py +0 -0
/vanna/{local.py → legacy/local.py} +0 -0
/vanna/{marqo → legacy/marqo}/__init__.py +0 -0
/vanna/{marqo → legacy/marqo}/marqo.py +0 -0
/vanna/{milvus → legacy/milvus}/__init__.py +0 -0
/vanna/{mistral → legacy/mistral}/__init__.py +0 -0
/vanna/{mistral → legacy/mistral}/mistral.py +0 -0
/vanna/{mock → legacy/mock}/__init__.py +0 -0
/vanna/{mock → legacy/mock}/embedding.py +0 -0
/vanna/{ollama → legacy/ollama}/__init__.py +0 -0
/vanna/{openai → legacy/openai}/__init__.py +0 -0
/vanna/{openai → legacy/openai}/openai_embeddings.py +0 -0
/vanna/{opensearch → legacy/opensearch}/__init__.py +0 -0
/vanna/{oracle → legacy/oracle}/__init__.py +0 -0
/vanna/{pgvector → legacy/pgvector}/__init__.py +0 -0
/vanna/{pinecone → legacy/pinecone}/__init__.py +0 -0
/vanna/{pinecone → legacy/pinecone}/pinecone_vector.py +0 -0
/vanna/{qdrant → legacy/qdrant}/__init__.py +0 -0
/vanna/{qianfan → legacy/qianfan}/__init__.py +0 -0
/vanna/{qianwen → legacy/qianwen}/QianwenAI_embeddings.py +0 -0
/vanna/{qianwen → legacy/qianwen}/__init__.py +0 -0
/vanna/{types → legacy/types}/__init__.py +0 -0
/vanna/{vannadb → legacy/vannadb}/__init__.py +0 -0
/vanna/{vllm → legacy/vllm}/__init__.py +0 -0
/vanna/{weaviate → legacy/weaviate}/__init__.py +0 -0
/vanna/{xinference → legacy/xinference}/__init__.py +0 -0
{vanna-0.7.9.dist-info → vanna-2.0.0rc1.dist-info}/WHEEL +0 -0
{vanna-0.7.9.dist-info → vanna-2.0.0rc1.dist-info}/licenses/LICENSE +0 -0

vanna/legacy/bedrock/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .bedrock_converse import Bedrock_Converse

vanna/{bedrock → legacy/bedrock}/bedrock_converse.py RENAMED Viewed

@@ -6,6 +6,7 @@ try:
 except ImportError:
     raise ImportError("Please install boto3 and botocore to use Amazon Bedrock models")
 class Bedrock_Converse(VannaBase):
     def __init__(self, client=None, config=None):
         VannaBase.__init__(self, config=config)
@@ -13,29 +14,27 @@ class Bedrock_Converse(VannaBase):
         # default parameters
         self.temperature = 0.0
         self.max_tokens = 500
         if client is None:
             raise ValueError(
                 "A valid Bedrock runtime client must be provided to invoke Bedrock models"
             )
         else:
             self.client = client
         if config is None:
             raise ValueError(
                 "Config is required with model_id and inference parameters"
             )
         if "modelId" not in config:
-            raise ValueError(
-                "config must contain a modelId to invoke"
-            )
+            raise ValueError("config must contain a modelId to invoke")
         else:
             self.model = config["modelId"]
         if "temperature" in config:
             self.temperature = config["temperature"]
         if "max_tokens" in config:
             self.max_tokens = config["max_tokens"]
@@ -51,7 +50,7 @@ class Bedrock_Converse(VannaBase):
     def submit_prompt(self, prompt, **kwargs) -> str:
         inference_config = {
             "temperature": self.temperature,
-            "maxTokens": self.max_tokens
+            "maxTokens": self.max_tokens,
         }
         additional_model_fields = {
             "top_p": 1,  # setting top_p value for nucleus sampling
@@ -64,13 +63,15 @@ class Bedrock_Converse(VannaBase):
             if role == "system":
                 system_message = prompt_message["content"]
             else:
-                no_system_prompt.append({"role": role, "content":[{"text": prompt_message["content"]}]})
+                no_system_prompt.append(
+                    {"role": role, "content": [{"text": prompt_message["content"]}]}
+                )
         converse_api_params = {
             "modelId": self.model,
             "messages": no_system_prompt,
             "inferenceConfig": inference_config,
-            "additionalModelRequestFields": additional_model_fields
+            "additionalModelRequestFields": additional_model_fields,
         }
         if system_message:
@@ -82,4 +83,4 @@ class Bedrock_Converse(VannaBase):
             return text_content
         except ClientError as err:
             message = err.response["Error"]["Message"]
-            raise Exception(f"A Bedrock client error occurred: {message}")
+            raise Exception(f"A Bedrock client error occurred: {message}")

vanna/{chromadb → legacy/chromadb}/chromadb_vector.py RENAMED Viewed

@@ -23,7 +23,9 @@ class ChromaDB_VectorStore(VannaBase):
         curr_client = config.get("client", "persistent")
         collection_metadata = config.get("collection_metadata", None)
         self.n_results_sql = config.get("n_results_sql", config.get("n_results", 10))
-        self.n_results_documentation = config.get("n_results_documentation", config.get("n_results", 10))
+        self.n_results_documentation = config.get(
+            "n_results_documentation", config.get("n_results", 10)
+        )
         self.n_results_ddl = config.get("n_results_ddl", config.get("n_results", 10))
         if curr_client == "persistent":

vanna/legacy/cohere/__init__.py ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ from .cohere_chat import Cohere_Chat
2	+ from .cohere_embeddings import Cohere_Embeddings

vanna/{cohere → legacy/cohere}/cohere_chat.py RENAMED Viewed

@@ -25,15 +25,17 @@ class Cohere_Chat(VannaBase):
         # Check for API key in environment variable
         api_key = os.getenv("COHERE_API_KEY")
         # Check for API key in config
         if config is not None and "api_key" in config:
             api_key = config["api_key"]
         # Validate API key
         if not api_key:
-            raise ValueError("Cohere API key is required. Please provide it via config or set the COHERE_API_KEY environment variable.")
+            raise ValueError(
+                "Cohere API key is required. Please provide it via config or set the COHERE_API_KEY environment variable."
+            )
         # Initialize client with validated API key
         self.client = OpenAI(
             base_url="https://api.cohere.ai/compatibility/v1",
@@ -41,7 +43,10 @@ class Cohere_Chat(VannaBase):
         )
     def system_message(self, message: str) -> any:
-        return {"role": "developer", "content": message}  # Cohere uses 'developer' for system role
+        return {
+            "role": "developer",
+            "content": message,
+        }  # Cohere uses 'developer' for system role
     def user_message(self, message: str) -> any:
         return {"role": "user", "content": message}
@@ -74,21 +79,21 @@ class Cohere_Chat(VannaBase):
                 messages=prompt,
                 temperature=self.temperature,
             )
             # Check if response has expected structure
-            if not response or not hasattr(response, 'choices') or not response.choices:
+            if not response or not hasattr(response, "choices") or not response.choices:
                 raise ValueError("Received empty or malformed response from API")
-            if not response.choices[0] or not hasattr(response.choices[0], 'message'):
+            if not response.choices[0] or not hasattr(response.choices[0], "message"):
                 raise ValueError("Response is missing expected 'message' field")
-            if not hasattr(response.choices[0].message, 'content'):
+            if not hasattr(response.choices[0].message, "content"):
                 raise ValueError("Response message is missing expected 'content' field")
             return response.choices[0].message.content
         except Exception as e:
             # Log the error and raise a more informative exception
             error_msg = f"Error processing Cohere chat response: {str(e)}"
             print(error_msg)
-            raise Exception(error_msg)
+            raise Exception(error_msg)

vanna/{cohere → legacy/cohere}/cohere_embeddings.py RENAMED Viewed

@@ -8,10 +8,10 @@ from ..base import VannaBase
 class Cohere_Embeddings(VannaBase):
     def __init__(self, client=None, config=None):
         VannaBase.__init__(self, config=config)
         # Default embedding model
         self.model = "embed-multilingual-v3.0"
         if config is not None and "model" in config:
             self.model = config["model"]
@@ -21,15 +21,17 @@ class Cohere_Embeddings(VannaBase):
         # Check for API key in environment variable
         api_key = os.getenv("COHERE_API_KEY")
         # Check for API key in config
         if config is not None and "api_key" in config:
             api_key = config["api_key"]
         # Validate API key
         if not api_key:
-            raise ValueError("Cohere API key is required. Please provide it via config or set the COHERE_API_KEY environment variable.")
+            raise ValueError(
+                "Cohere API key is required. Please provide it via config or set the COHERE_API_KEY environment variable."
+            )
         # Initialize client with validated API key
         self.client = OpenAI(
             base_url="https://api.cohere.ai/compatibility/v1",
@@ -39,33 +41,37 @@ class Cohere_Embeddings(VannaBase):
     def generate_embedding(self, data: str, **kwargs) -> list[float]:
         if not data:
             raise ValueError("Cannot generate embedding for empty input data")
         # Use model from kwargs, config, or default
         model = kwargs.get("model", self.model)
         if self.config is not None and "model" in self.config and model == self.model:
             model = self.config["model"]
-        try:
+        try:
             embedding = self.client.embeddings.create(
                 model=model,
                 input=data,
                 encoding_format="float",  # Ensure we get float values
             )
             # Check if response has expected structure
-            if not embedding or not hasattr(embedding, 'data') or not embedding.data:
-                raise ValueError("Received empty or malformed embedding response from API")
-            if not embedding.data[0] or not hasattr(embedding.data[0], 'embedding'):
-                raise ValueError("Embedding response is missing expected 'embedding' field")
+            if not embedding or not hasattr(embedding, "data") or not embedding.data:
+                raise ValueError(
+                    "Received empty or malformed embedding response from API"
+                )
+            if not embedding.data[0] or not hasattr(embedding.data[0], "embedding"):
+                raise ValueError(
+                    "Embedding response is missing expected 'embedding' field"
+                )
             if not embedding.data[0].embedding:
                 raise ValueError("Received empty embedding vector")
             return embedding.data[0].embedding
         except Exception as e:
             # Log the error and raise a more informative exception
             error_msg = f"Error generating embedding with Cohere: {str(e)}"
             print(error_msg)
-            raise Exception(error_msg)
+            raise Exception(error_msg)

vanna/{deepseek → legacy/deepseek}/deepseek_chat.py RENAMED Viewed

@@ -5,7 +5,6 @@ from openai import OpenAI
 from ..base import VannaBase
 # from vanna.chromadb import ChromaDB_VectorStore
 # class DeepSeekVanna(ChromaDB_VectorStore, DeepSeekChat):
@@ -27,12 +26,12 @@ class DeepSeekChat(VannaBase):
         if "model" not in config:
             raise ValueError("config must contain a DeepSeek model")
         api_key = config["api_key"]
         model = config["model"]
         self.model = model
         self.client = OpenAI(api_key=api_key, base_url="https://api.deepseek.com/v1")
     def system_message(self, message: str) -> any:
         return {"role": "system", "content": message}
@@ -45,10 +44,10 @@ class DeepSeekChat(VannaBase):
     def generate_sql(self, question: str, **kwargs) -> str:
         # 使用父类的 generate_sql
         sql = super().generate_sql(question, **kwargs)
         # 替换 "\_" 为 "_"
         sql = sql.replace("\\_", "_")
         return sql
     def submit_prompt(self, prompt, **kwargs) -> str:
@@ -56,5 +55,5 @@ class DeepSeekChat(VannaBase):
             model=self.model,
             messages=prompt,
         )
         return chat_response.choices[0].message.content

vanna/legacy/faiss/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .faiss import FAISS

vanna/{faiss → legacy/faiss}/faiss.py RENAMED Viewed

@@ -1,4 +1,4 @@
-import os
+import os
 import json
 import uuid
 from typing import List, Dict, Any
@@ -10,13 +10,14 @@ import pandas as pd
 from ..base import VannaBase
 from ..exceptions import DependencyError
 class FAISS(VannaBase):
     def __init__(self, config=None):
         if config is None:
             config = {}
         VannaBase.__init__(self, config=config)
         try:
             import faiss
         except ImportError:
@@ -30,34 +31,48 @@ class FAISS(VannaBase):
             raise DependencyError(
                 "SentenceTransformer is not installed. Please install it with 'pip install sentence-transformers'."
             )
         self.path = config.get("path", ".")
-        self.embedding_dim = config.get('embedding_dim', 384)
-        self.n_results_sql = config.get('n_results_sql', config.get("n_results", 10))
-        self.n_results_ddl = config.get('n_results_ddl', config.get("n_results", 10))
-        self.n_results_documentation = config.get('n_results_documentation', config.get("n_results", 10))
+        self.embedding_dim = config.get("embedding_dim", 384)
+        self.n_results_sql = config.get("n_results_sql", config.get("n_results", 10))
+        self.n_results_ddl = config.get("n_results_ddl", config.get("n_results", 10))
+        self.n_results_documentation = config.get(
+            "n_results_documentation", config.get("n_results", 10)
+        )
         self.curr_client = config.get("client", "persistent")
-        if self.curr_client == 'persistent':
-            self.sql_index = self._load_or_create_index('sql_index.faiss')
-            self.ddl_index = self._load_or_create_index('ddl_index.faiss')
-            self.doc_index = self._load_or_create_index('doc_index.faiss')
-        elif self.curr_client == 'in-memory':
+        if self.curr_client == "persistent":
+            self.sql_index = self._load_or_create_index("sql_index.faiss")
+            self.ddl_index = self._load_or_create_index("ddl_index.faiss")
+            self.doc_index = self._load_or_create_index("doc_index.faiss")
+        elif self.curr_client == "in-memory":
             self.sql_index = faiss.IndexFlatL2(self.embedding_dim)
             self.ddl_index = faiss.IndexFlatL2(self.embedding_dim)
             self.doc_index = faiss.IndexFlatL2(self.embedding_dim)
-        elif isinstance(self.curr_client, list) and len(self.curr_client) == 3 and all(isinstance(idx, faiss.Index) for idx in self.curr_client):
+        elif (
+            isinstance(self.curr_client, list)
+            and len(self.curr_client) == 3
+            and all(isinstance(idx, faiss.Index) for idx in self.curr_client)
+        ):
             self.sql_index = self.curr_client[0]
             self.ddl_index = self.curr_client[1]
             self.doc_index = self.curr_client[2]
         else:
-            raise ValueError(f"Unsupported storage type was set in config: {self.curr_client}")
-        self.sql_metadata: List[Dict[str, Any]] = self._load_or_create_metadata('sql_metadata.json')
-        self.ddl_metadata: List[Dict[str, str]] = self._load_or_create_metadata('ddl_metadata.json')
-        self.doc_metadata: List[Dict[str, str]] = self._load_or_create_metadata('doc_metadata.json')
+            raise ValueError(
+                f"Unsupported storage type was set in config: {self.curr_client}"
+            )
-        model_name = config.get('embedding_model', 'all-MiniLM-L6-v2')
+        self.sql_metadata: List[Dict[str, Any]] = self._load_or_create_metadata(
+            "sql_metadata.json"
+        )
+        self.ddl_metadata: List[Dict[str, str]] = self._load_or_create_metadata(
+            "ddl_metadata.json"
+        )
+        self.doc_metadata: List[Dict[str, str]] = self._load_or_create_metadata(
+            "doc_metadata.json"
+        )
+        model_name = config.get("embedding_model", "all-MiniLM-L6-v2")
         self.embedding_model = SentenceTransformer(model_name)
     def _load_or_create_index(self, filename):
@@ -69,25 +84,26 @@ class FAISS(VannaBase):
     def _load_or_create_metadata(self, filename):
         filepath = os.path.join(self.path, filename)
         if os.path.exists(filepath):
-            with open(filepath, 'r') as f:
+            with open(filepath, "r") as f:
                 return json.load(f)
         return []
     def _save_index(self, index, filename):
-        if self.curr_client == 'persistent':
+        if self.curr_client == "persistent":
             filepath = os.path.join(self.path, filename)
             faiss.write_index(index, filepath)
     def _save_metadata(self, metadata, filename):
-        if self.curr_client == 'persistent':
+        if self.curr_client == "persistent":
             filepath = os.path.join(self.path, filename)
-            with open(filepath, 'w') as f:
+            with open(filepath, "w") as f:
                 json.dump(metadata, f)
     def generate_embedding(self, data: str, **kwargs) -> List[float]:
         embedding = self.embedding_model.encode(data)
-        assert embedding.shape[0] == self.embedding_dim, \
+        assert embedding.shape[0] == self.embedding_dim, (
             f"Embedding dimension mismatch: expected {self.embedding_dim}, got {embedding.shape[0]}"
+        )
         return embedding.tolist()
     def _add_to_index(self, index, metadata_list, text, extra_metadata=None) -> str:
@@ -96,81 +112,119 @@ class FAISS(VannaBase):
         entry_id = str(uuid.uuid4())
         metadata_list.append({"id": entry_id, **(extra_metadata or {})})
         return entry_id
     def add_question_sql(self, question: str, sql: str, **kwargs) -> str:
-        entry_id = self._add_to_index(self.sql_index, self.sql_metadata, question + " " + sql, {"question": question, "sql": sql})
-        self._save_index(self.sql_index, 'sql_index.faiss')
-        self._save_metadata(self.sql_metadata, 'sql_metadata.json')
+        entry_id = self._add_to_index(
+            self.sql_index,
+            self.sql_metadata,
+            question + " " + sql,
+            {"question": question, "sql": sql},
+        )
+        self._save_index(self.sql_index, "sql_index.faiss")
+        self._save_metadata(self.sql_metadata, "sql_metadata.json")
         return entry_id
     def add_ddl(self, ddl: str, **kwargs) -> str:
-        entry_id = self._add_to_index(self.ddl_index, self.ddl_metadata, ddl, {"ddl": ddl})
-        self._save_index(self.ddl_index, 'ddl_index.faiss')
-        self._save_metadata(self.ddl_metadata, 'ddl_metadata.json')
+        entry_id = self._add_to_index(
+            self.ddl_index, self.ddl_metadata, ddl, {"ddl": ddl}
+        )
+        self._save_index(self.ddl_index, "ddl_index.faiss")
+        self._save_metadata(self.ddl_metadata, "ddl_metadata.json")
         return entry_id
     def add_documentation(self, documentation: str, **kwargs) -> str:
-        entry_id = self._add_to_index(self.doc_index, self.doc_metadata, documentation, {"documentation": documentation})
-        self._save_index(self.doc_index, 'doc_index.faiss')
-        self._save_metadata(self.doc_metadata, 'doc_metadata.json')
+        entry_id = self._add_to_index(
+            self.doc_index,
+            self.doc_metadata,
+            documentation,
+            {"documentation": documentation},
+        )
+        self._save_index(self.doc_index, "doc_index.faiss")
+        self._save_metadata(self.doc_metadata, "doc_metadata.json")
         return entry_id
     def _get_similar(self, index, metadata_list, text, n_results) -> list:
         embedding = self.generate_embedding(text)
         D, I = index.search(np.array([embedding], dtype=np.float32), k=n_results)
-        return [] if len(I[0]) == 0 or I[0][0] == -1 else [metadata_list[i] for i in I[0]]
+        return (
+            [] if len(I[0]) == 0 or I[0][0] == -1 else [metadata_list[i] for i in I[0]]
+        )
     def get_similar_question_sql(self, question: str, **kwargs) -> list:
-        return self._get_similar(self.sql_index, self.sql_metadata, question, self.n_results_sql)
+        return self._get_similar(
+            self.sql_index, self.sql_metadata, question, self.n_results_sql
+        )
     def get_related_ddl(self, question: str, **kwargs) -> list:
-        return [metadata["ddl"] for metadata in self._get_similar(self.ddl_index, self.ddl_metadata, question, self.n_results_ddl)]
+        return [
+            metadata["ddl"]
+            for metadata in self._get_similar(
+                self.ddl_index, self.ddl_metadata, question, self.n_results_ddl
+            )
+        ]
     def get_related_documentation(self, question: str, **kwargs) -> list:
-        return [metadata["documentation"] for metadata in self._get_similar(self.doc_index, self.doc_metadata, question, self.n_results_documentation)]
+        return [
+            metadata["documentation"]
+            for metadata in self._get_similar(
+                self.doc_index,
+                self.doc_metadata,
+                question,
+                self.n_results_documentation,
+            )
+        ]
     def get_training_data(self, **kwargs) -> pd.DataFrame:
         sql_data = pd.DataFrame(self.sql_metadata)
-        sql_data['training_data_type'] = 'sql'
+        sql_data["training_data_type"] = "sql"
         ddl_data = pd.DataFrame(self.ddl_metadata)
-        ddl_data['training_data_type'] = 'ddl'
+        ddl_data["training_data_type"] = "ddl"
         doc_data = pd.DataFrame(self.doc_metadata)
-        doc_data['training_data_type'] = 'documentation'
+        doc_data["training_data_type"] = "documentation"
         return pd.concat([sql_data, ddl_data, doc_data], ignore_index=True)
     def remove_training_data(self, id: str, **kwargs) -> bool:
         for metadata_list, index, index_name in [
-            (self.sql_metadata, self.sql_index, 'sql_index.faiss'),
-            (self.ddl_metadata, self.ddl_index, 'ddl_index.faiss'),
-            (self.doc_metadata, self.doc_index, 'doc_index.faiss')
+            (self.sql_metadata, self.sql_index, "sql_index.faiss"),
+            (self.ddl_metadata, self.ddl_index, "ddl_index.faiss"),
+            (self.doc_metadata, self.doc_index, "doc_index.faiss"),
         ]:
             for i, item in enumerate(metadata_list):
-                if item['id'] == id:
+                if item["id"] == id:
                     del metadata_list[i]
                     new_index = faiss.IndexFlatL2(self.embedding_dim)
-                    embeddings = [self.generate_embedding(json.dumps(m)) for m in metadata_list]
+                    embeddings = [
+                        self.generate_embedding(json.dumps(m)) for m in metadata_list
+                    ]
                     if embeddings:
                         new_index.add(np.array(embeddings, dtype=np.float32))
-                    setattr(self, index_name.split('.')[0], new_index)
-                    if self.curr_client == 'persistent':
+                    setattr(self, index_name.split(".")[0], new_index)
+                    if self.curr_client == "persistent":
                         self._save_index(new_index, index_name)
-                        self._save_metadata(metadata_list, f"{index_name.split('.')[0]}_metadata.json")
+                        self._save_metadata(
+                            metadata_list, f"{index_name.split('.')[0]}_metadata.json"
+                        )
                     return True
         return False
     def remove_collection(self, collection_name: str) -> bool:
         if collection_name in ["sql", "ddl", "documentation"]:
-            setattr(self, f"{collection_name}_index", faiss.IndexFlatL2(self.embedding_dim))
+            setattr(
+                self, f"{collection_name}_index", faiss.IndexFlatL2(self.embedding_dim)
+            )
             setattr(self, f"{collection_name}_metadata", [])
-            if self.curr_client == 'persistent':
-                self._save_index(getattr(self, f"{collection_name}_index"), f"{collection_name}_index.faiss")
+            if self.curr_client == "persistent":
+                self._save_index(
+                    getattr(self, f"{collection_name}_index"),
+                    f"{collection_name}_index.faiss",
+                )
                 self._save_metadata([], f"{collection_name}_metadata.json")
             return True
-        return False
+        return False

vanna 0.7.9__py3-none-any.whl → 2.0.0rc1__py3-none-any.whl

vanna 0.7.9py3-none-any.whl → 2.0.0rc1py3-none-any.whl