PyPI - vanna - Versions diffs - 0.7.8__py3-none-any.whl → 2.0.0__py3-none-any.whl - Mend

vanna 0.7.8py3-none-any.whl → 2.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (302) hide show

vanna/__init__.py +167 -395
vanna/agents/__init__.py +7 -0
vanna/capabilities/__init__.py +17 -0
vanna/capabilities/agent_memory/__init__.py +21 -0
vanna/capabilities/agent_memory/base.py +103 -0
vanna/capabilities/agent_memory/models.py +53 -0
vanna/capabilities/file_system/__init__.py +14 -0
vanna/capabilities/file_system/base.py +71 -0
vanna/capabilities/file_system/models.py +25 -0
vanna/capabilities/sql_runner/__init__.py +13 -0
vanna/capabilities/sql_runner/base.py +37 -0
vanna/capabilities/sql_runner/models.py +13 -0
vanna/components/__init__.py +92 -0
vanna/components/base.py +11 -0
vanna/components/rich/__init__.py +83 -0
vanna/components/rich/containers/__init__.py +7 -0
vanna/components/rich/containers/card.py +20 -0
vanna/components/rich/data/__init__.py +9 -0
vanna/components/rich/data/chart.py +17 -0
vanna/components/rich/data/dataframe.py +93 -0
vanna/components/rich/feedback/__init__.py +21 -0
vanna/components/rich/feedback/badge.py +16 -0
vanna/components/rich/feedback/icon_text.py +14 -0
vanna/components/rich/feedback/log_viewer.py +41 -0
vanna/components/rich/feedback/notification.py +19 -0
vanna/components/rich/feedback/progress.py +37 -0
vanna/components/rich/feedback/status_card.py +28 -0
vanna/components/rich/feedback/status_indicator.py +14 -0
vanna/components/rich/interactive/__init__.py +21 -0
vanna/components/rich/interactive/button.py +95 -0
vanna/components/rich/interactive/task_list.py +58 -0
vanna/components/rich/interactive/ui_state.py +93 -0
vanna/components/rich/specialized/__init__.py +7 -0
vanna/components/rich/specialized/artifact.py +20 -0
vanna/components/rich/text.py +16 -0
vanna/components/simple/__init__.py +15 -0
vanna/components/simple/image.py +15 -0
vanna/components/simple/link.py +15 -0
vanna/components/simple/text.py +11 -0
vanna/core/__init__.py +193 -0
vanna/core/_compat.py +19 -0
vanna/core/agent/__init__.py +10 -0
vanna/core/agent/agent.py +1407 -0
vanna/core/agent/config.py +123 -0
vanna/core/audit/__init__.py +28 -0
vanna/core/audit/base.py +299 -0
vanna/core/audit/models.py +131 -0
vanna/core/component_manager.py +329 -0
vanna/core/components.py +53 -0
vanna/core/enhancer/__init__.py +11 -0
vanna/core/enhancer/base.py +94 -0
vanna/core/enhancer/default.py +118 -0
vanna/core/enricher/__init__.py +10 -0
vanna/core/enricher/base.py +59 -0
vanna/core/errors.py +47 -0
vanna/core/evaluation/__init__.py +81 -0
vanna/core/evaluation/base.py +186 -0
vanna/core/evaluation/dataset.py +254 -0
vanna/core/evaluation/evaluators.py +376 -0
vanna/core/evaluation/report.py +289 -0
vanna/core/evaluation/runner.py +313 -0
vanna/core/filter/__init__.py +10 -0
vanna/core/filter/base.py +67 -0
vanna/core/lifecycle/__init__.py +10 -0
vanna/core/lifecycle/base.py +83 -0
vanna/core/llm/__init__.py +16 -0
vanna/core/llm/base.py +40 -0
vanna/core/llm/models.py +61 -0
vanna/core/middleware/__init__.py +10 -0
vanna/core/middleware/base.py +69 -0
vanna/core/observability/__init__.py +11 -0
vanna/core/observability/base.py +88 -0
vanna/core/observability/models.py +47 -0
vanna/core/recovery/__init__.py +11 -0
vanna/core/recovery/base.py +84 -0
vanna/core/recovery/models.py +32 -0
vanna/core/registry.py +278 -0
vanna/core/rich_component.py +156 -0
vanna/core/simple_component.py +27 -0
vanna/core/storage/__init__.py +14 -0
vanna/core/storage/base.py +46 -0
vanna/core/storage/models.py +46 -0
vanna/core/system_prompt/__init__.py +13 -0
vanna/core/system_prompt/base.py +36 -0
vanna/core/system_prompt/default.py +157 -0
vanna/core/tool/__init__.py +18 -0
vanna/core/tool/base.py +70 -0
vanna/core/tool/models.py +84 -0
vanna/core/user/__init__.py +17 -0
vanna/core/user/base.py +29 -0
vanna/core/user/models.py +25 -0
vanna/core/user/request_context.py +70 -0
vanna/core/user/resolver.py +42 -0
vanna/core/validation.py +164 -0
vanna/core/workflow/__init__.py +12 -0
vanna/core/workflow/base.py +254 -0
vanna/core/workflow/default.py +789 -0
vanna/examples/__init__.py +1 -0
vanna/examples/__main__.py +44 -0
vanna/examples/anthropic_quickstart.py +80 -0
vanna/examples/artifact_example.py +293 -0
vanna/examples/claude_sqlite_example.py +236 -0
vanna/examples/coding_agent_example.py +300 -0
vanna/examples/custom_system_prompt_example.py +174 -0
vanna/examples/default_workflow_handler_example.py +208 -0
vanna/examples/email_auth_example.py +340 -0
vanna/examples/evaluation_example.py +269 -0
vanna/examples/extensibility_example.py +262 -0
vanna/examples/minimal_example.py +67 -0
vanna/examples/mock_auth_example.py +227 -0
vanna/examples/mock_custom_tool.py +311 -0
vanna/examples/mock_quickstart.py +79 -0
vanna/examples/mock_quota_example.py +145 -0
vanna/examples/mock_rich_components_demo.py +396 -0
vanna/examples/mock_sqlite_example.py +223 -0
vanna/examples/openai_quickstart.py +83 -0
vanna/examples/primitive_components_demo.py +305 -0
vanna/examples/quota_lifecycle_example.py +139 -0
vanna/examples/visualization_example.py +251 -0
vanna/integrations/__init__.py +17 -0
vanna/integrations/anthropic/__init__.py +9 -0
vanna/integrations/anthropic/llm.py +270 -0
vanna/integrations/azureopenai/__init__.py +9 -0
vanna/integrations/azureopenai/llm.py +329 -0
vanna/integrations/azuresearch/__init__.py +7 -0
vanna/integrations/azuresearch/agent_memory.py +413 -0
vanna/integrations/bigquery/__init__.py +5 -0
vanna/integrations/bigquery/sql_runner.py +81 -0
vanna/integrations/chromadb/__init__.py +104 -0
vanna/integrations/chromadb/agent_memory.py +416 -0
vanna/integrations/clickhouse/__init__.py +5 -0
vanna/integrations/clickhouse/sql_runner.py +82 -0
vanna/integrations/duckdb/__init__.py +5 -0
vanna/integrations/duckdb/sql_runner.py +65 -0
vanna/integrations/faiss/__init__.py +7 -0
vanna/integrations/faiss/agent_memory.py +431 -0
vanna/integrations/google/__init__.py +9 -0
vanna/integrations/google/gemini.py +370 -0
vanna/integrations/hive/__init__.py +5 -0
vanna/integrations/hive/sql_runner.py +87 -0
vanna/integrations/local/__init__.py +17 -0
vanna/integrations/local/agent_memory/__init__.py +7 -0
vanna/integrations/local/agent_memory/in_memory.py +285 -0
vanna/integrations/local/audit.py +59 -0
vanna/integrations/local/file_system.py +242 -0
vanna/integrations/local/file_system_conversation_store.py +255 -0
vanna/integrations/local/storage.py +62 -0
vanna/integrations/marqo/__init__.py +7 -0
vanna/integrations/marqo/agent_memory.py +354 -0
vanna/integrations/milvus/__init__.py +7 -0
vanna/integrations/milvus/agent_memory.py +458 -0
vanna/integrations/mock/__init__.py +9 -0
vanna/integrations/mock/llm.py +65 -0
vanna/integrations/mssql/__init__.py +5 -0
vanna/integrations/mssql/sql_runner.py +66 -0
vanna/integrations/mysql/__init__.py +5 -0
vanna/integrations/mysql/sql_runner.py +92 -0
vanna/integrations/ollama/__init__.py +7 -0
vanna/integrations/ollama/llm.py +252 -0
vanna/integrations/openai/__init__.py +10 -0
vanna/integrations/openai/llm.py +267 -0
vanna/integrations/openai/responses.py +163 -0
vanna/integrations/opensearch/__init__.py +7 -0
vanna/integrations/opensearch/agent_memory.py +411 -0
vanna/integrations/oracle/__init__.py +5 -0
vanna/integrations/oracle/sql_runner.py +75 -0
vanna/integrations/pinecone/__init__.py +7 -0
vanna/integrations/pinecone/agent_memory.py +329 -0
vanna/integrations/plotly/__init__.py +5 -0
vanna/integrations/plotly/chart_generator.py +313 -0
vanna/integrations/postgres/__init__.py +9 -0
vanna/integrations/postgres/sql_runner.py +112 -0
vanna/integrations/premium/agent_memory/__init__.py +7 -0
vanna/integrations/premium/agent_memory/premium.py +186 -0
vanna/integrations/presto/__init__.py +5 -0
vanna/integrations/presto/sql_runner.py +107 -0
vanna/integrations/qdrant/__init__.py +7 -0
vanna/integrations/qdrant/agent_memory.py +461 -0
vanna/integrations/snowflake/__init__.py +5 -0
vanna/integrations/snowflake/sql_runner.py +147 -0
vanna/integrations/sqlite/__init__.py +9 -0
vanna/integrations/sqlite/sql_runner.py +65 -0
vanna/integrations/weaviate/__init__.py +7 -0
vanna/integrations/weaviate/agent_memory.py +428 -0
vanna/{ZhipuAI → legacy/ZhipuAI}/ZhipuAI_embeddings.py +11 -11
vanna/legacy/__init__.py +403 -0
vanna/legacy/adapter.py +463 -0
vanna/{advanced → legacy/advanced}/__init__.py +3 -1
vanna/{anthropic → legacy/anthropic}/anthropic_chat.py +9 -7
vanna/{azuresearch → legacy/azuresearch}/azuresearch_vector.py +79 -41
vanna/{base → legacy/base}/base.py +247 -223
vanna/legacy/bedrock/__init__.py +1 -0
vanna/{bedrock → legacy/bedrock}/bedrock_converse.py +13 -12
vanna/{chromadb → legacy/chromadb}/chromadb_vector.py +3 -1
vanna/legacy/cohere/__init__.py +2 -0
vanna/{cohere → legacy/cohere}/cohere_chat.py +19 -14
vanna/{cohere → legacy/cohere}/cohere_embeddings.py +25 -19
vanna/{deepseek → legacy/deepseek}/deepseek_chat.py +5 -6
vanna/legacy/faiss/__init__.py +1 -0
vanna/{faiss → legacy/faiss}/faiss.py +113 -59
vanna/{flask → legacy/flask}/__init__.py +84 -43
vanna/{flask → legacy/flask}/assets.py +5 -5
vanna/{flask → legacy/flask}/auth.py +5 -4
vanna/{google → legacy/google}/bigquery_vector.py +75 -42
vanna/{google → legacy/google}/gemini_chat.py +7 -3
vanna/{hf → legacy/hf}/hf.py +0 -1
vanna/{milvus → legacy/milvus}/milvus_vector.py +58 -35
vanna/{mock → legacy/mock}/llm.py +0 -1
vanna/legacy/mock/vectordb.py +67 -0
vanna/legacy/ollama/ollama.py +110 -0
vanna/{openai → legacy/openai}/openai_chat.py +2 -6
vanna/legacy/opensearch/opensearch_vector.py +369 -0
vanna/legacy/opensearch/opensearch_vector_semantic.py +200 -0
vanna/legacy/oracle/oracle_vector.py +584 -0
vanna/{pgvector → legacy/pgvector}/pgvector.py +42 -13
vanna/{qdrant → legacy/qdrant}/qdrant.py +2 -6
vanna/legacy/qianfan/Qianfan_Chat.py +170 -0
vanna/legacy/qianfan/Qianfan_embeddings.py +36 -0
vanna/legacy/qianwen/QianwenAI_chat.py +132 -0
vanna/{remote.py → legacy/remote.py} +28 -26
vanna/{utils.py → legacy/utils.py} +6 -11
vanna/{vannadb → legacy/vannadb}/vannadb_vector.py +115 -46
vanna/{vllm → legacy/vllm}/vllm.py +5 -6
vanna/{weaviate → legacy/weaviate}/weaviate_vector.py +59 -40
vanna/{xinference → legacy/xinference}/xinference.py +6 -6
vanna/py.typed +0 -0
vanna/servers/__init__.py +16 -0
vanna/servers/__main__.py +8 -0
vanna/servers/base/__init__.py +18 -0
vanna/servers/base/chat_handler.py +65 -0
vanna/servers/base/models.py +111 -0
vanna/servers/base/rich_chat_handler.py +141 -0
vanna/servers/base/templates.py +331 -0
vanna/servers/cli/__init__.py +7 -0
vanna/servers/cli/server_runner.py +204 -0
vanna/servers/fastapi/__init__.py +7 -0
vanna/servers/fastapi/app.py +163 -0
vanna/servers/fastapi/routes.py +183 -0
vanna/servers/flask/__init__.py +7 -0
vanna/servers/flask/app.py +132 -0
vanna/servers/flask/routes.py +137 -0
vanna/tools/__init__.py +41 -0
vanna/tools/agent_memory.py +322 -0
vanna/tools/file_system.py +879 -0
vanna/tools/python.py +222 -0
vanna/tools/run_sql.py +165 -0
vanna/tools/visualize_data.py +195 -0
vanna/utils/__init__.py +0 -0
vanna/web_components/__init__.py +44 -0
vanna-2.0.0.dist-info/METADATA +485 -0
vanna-2.0.0.dist-info/RECORD +289 -0
vanna-2.0.0.dist-info/entry_points.txt +3 -0
vanna/bedrock/__init__.py +0 -1
vanna/cohere/__init__.py +0 -2
vanna/faiss/__init__.py +0 -1
vanna/mock/vectordb.py +0 -55
vanna/ollama/ollama.py +0 -103
vanna/opensearch/opensearch_vector.py +0 -392
vanna/opensearch/opensearch_vector_semantic.py +0 -175
vanna/oracle/oracle_vector.py +0 -585
vanna/qianfan/Qianfan_Chat.py +0 -165
vanna/qianfan/Qianfan_embeddings.py +0 -36
vanna/qianwen/QianwenAI_chat.py +0 -133
vanna-0.7.8.dist-info/METADATA +0 -408
vanna-0.7.8.dist-info/RECORD +0 -79
/vanna/{ZhipuAI → legacy/ZhipuAI}/ZhipuAI_Chat.py +0 -0
/vanna/{ZhipuAI → legacy/ZhipuAI}/__init__.py +0 -0
/vanna/{anthropic → legacy/anthropic}/__init__.py +0 -0
/vanna/{azuresearch → legacy/azuresearch}/__init__.py +0 -0
/vanna/{base → legacy/base}/__init__.py +0 -0
/vanna/{chromadb → legacy/chromadb}/__init__.py +0 -0
/vanna/{deepseek → legacy/deepseek}/__init__.py +0 -0
/vanna/{exceptions → legacy/exceptions}/__init__.py +0 -0
/vanna/{google → legacy/google}/__init__.py +0 -0
/vanna/{hf → legacy/hf}/__init__.py +0 -0
/vanna/{local.py → legacy/local.py} +0 -0
/vanna/{marqo → legacy/marqo}/__init__.py +0 -0
/vanna/{marqo → legacy/marqo}/marqo.py +0 -0
/vanna/{milvus → legacy/milvus}/__init__.py +0 -0
/vanna/{mistral → legacy/mistral}/__init__.py +0 -0
/vanna/{mistral → legacy/mistral}/mistral.py +0 -0
/vanna/{mock → legacy/mock}/__init__.py +0 -0
/vanna/{mock → legacy/mock}/embedding.py +0 -0
/vanna/{ollama → legacy/ollama}/__init__.py +0 -0
/vanna/{openai → legacy/openai}/__init__.py +0 -0
/vanna/{openai → legacy/openai}/openai_embeddings.py +0 -0
/vanna/{opensearch → legacy/opensearch}/__init__.py +0 -0
/vanna/{oracle → legacy/oracle}/__init__.py +0 -0
/vanna/{pgvector → legacy/pgvector}/__init__.py +0 -0
/vanna/{pinecone → legacy/pinecone}/__init__.py +0 -0
/vanna/{pinecone → legacy/pinecone}/pinecone_vector.py +0 -0
/vanna/{qdrant → legacy/qdrant}/__init__.py +0 -0
/vanna/{qianfan → legacy/qianfan}/__init__.py +0 -0
/vanna/{qianwen → legacy/qianwen}/QianwenAI_embeddings.py +0 -0
/vanna/{qianwen → legacy/qianwen}/__init__.py +0 -0
/vanna/{types → legacy/types}/__init__.py +0 -0
/vanna/{vannadb → legacy/vannadb}/__init__.py +0 -0
/vanna/{vllm → legacy/vllm}/__init__.py +0 -0
/vanna/{weaviate → legacy/weaviate}/__init__.py +0 -0
/vanna/{xinference → legacy/xinference}/__init__.py +0 -0
{vanna-0.7.8.dist-info → vanna-2.0.0.dist-info}/WHEEL +0 -0
{vanna-0.7.8.dist-info → vanna-2.0.0.dist-info}/licenses/LICENSE +0 -0

vanna/{google → legacy/google}/bigquery_vector.py RENAMED Viewed

@@ -2,10 +2,7 @@ import datetime
 import os
 import uuid
 from typing import List, Optional
-from vertexai.language_models import (
-  TextEmbeddingInput,
-  TextEmbeddingModel
-)
+from vertexai.language_models import TextEmbeddingInput, TextEmbeddingModel
 import pandas as pd
 from google.cloud import bigquery
@@ -18,7 +15,9 @@ class BigQuery_VectorStore(VannaBase):
         self.config = config
         self.n_results_sql = config.get("n_results_sql", config.get("n_results", 10))
-        self.n_results_documentation = config.get("n_results_documentation", config.get("n_results", 10))
+        self.n_results_documentation = config.get(
+            "n_results_documentation", config.get("n_results", 10)
+        )
         self.n_results_ddl = config.get("n_results_ddl", config.get("n_results", 10))
         if "api_key" in config or os.getenv("GOOGLE_API_KEY"):
@@ -47,7 +46,7 @@ class BigQuery_VectorStore(VannaBase):
         self.conn = bigquery.Client(project=self.project_id)
-        dataset_name = self.config.get('bigquery_dataset_name', 'vanna_managed')
+        dataset_name = self.config.get("bigquery_dataset_name", "vanna_managed")
         self.dataset_id = f"{self.project_id}.{dataset_name}"
         dataset = bigquery.Dataset(self.dataset_id)
@@ -101,21 +100,35 @@ class BigQuery_VectorStore(VannaBase):
         # except Exception as e:
         #     print(f"Failed to create vector index: {e}")
-    def store_training_data(self, training_data_type: str, question: str, content: str, embedding: List[float], **kwargs) -> str:
+    def store_training_data(
+        self,
+        training_data_type: str,
+        question: str,
+        content: str,
+        embedding: List[float],
+        **kwargs,
+    ) -> str:
         id = str(uuid.uuid4())
         created_at = datetime.datetime.now()
-        self.conn.insert_rows_json(self.table_id, [{
-            "id": id,
-            "training_data_type": training_data_type,
-            "question": question,
-            "content": content,
-            "embedding": embedding,
-            "created_at": created_at.isoformat()
-        }])
+        self.conn.insert_rows_json(
+            self.table_id,
+            [
+                {
+                    "id": id,
+                    "training_data_type": training_data_type,
+                    "question": question,
+                    "content": content,
+                    "embedding": embedding,
+                    "created_at": created_at.isoformat(),
+                }
+            ],
+        )
         return id
-    def fetch_similar_training_data(self, training_data_type: str, question: str, n_results, **kwargs) -> pd.DataFrame:
+    def fetch_similar_training_data(
+        self, training_data_type: str, question: str, n_results, **kwargs
+    ) -> pd.DataFrame:
         question_embedding = self.generate_question_embedding(question)
         query = f"""
@@ -145,29 +158,28 @@ class BigQuery_VectorStore(VannaBase):
         embeddings = None
         if self.type == "VERTEX_AI":
-          input = [TextEmbeddingInput(data, task)]
-          model = TextEmbeddingModel.from_pretrained("text-embedding-004")
+            input = [TextEmbeddingInput(data, task)]
+            model = TextEmbeddingModel.from_pretrained("text-embedding-004")
-          result = model.get_embeddings(input)
+            result = model.get_embeddings(input)
-          if len(result) > 0:
-              embeddings = result[0].values
+            if len(result) > 0:
+                embeddings = result[0].values
         else:
-          # Use Gemini Consumer API
-          result = self.genai.embed_content(
-            model="models/text-embedding-004",
-            content=data,
-            task_type=task)
+            # Use Gemini Consumer API
+            result = self.genai.embed_content(
+                model="models/text-embedding-004", content=data, task_type=task
+            )
-          if 'embedding' in result:
-            embeddings = result['embedding']
+            if "embedding" in result:
+                embeddings = result["embedding"]
         return embeddings
     def generate_question_embedding(self, data: str, **kwargs) -> List[float]:
         result = self.get_embeddings(data, "RETRIEVAL_QUERY")
-        if result != None:
+        if result is not None:
             return result
         else:
             raise ValueError("No embeddings returned")
@@ -175,7 +187,7 @@ class BigQuery_VectorStore(VannaBase):
     def generate_storage_embedding(self, data: str, **kwargs) -> List[float]:
         result = self.get_embeddings(data, "RETRIEVAL_DOCUMENT")
-        if result != None:
+        if result is not None:
             return result
         else:
             raise ValueError("No embeddings returned")
@@ -195,45 +207,66 @@ class BigQuery_VectorStore(VannaBase):
         return self.generate_storage_embedding(data, **kwargs)
     def get_similar_question_sql(self, question: str, **kwargs) -> list:
-        df = self.fetch_similar_training_data(training_data_type="sql", question=question, n_results=self.n_results_sql)
+        df = self.fetch_similar_training_data(
+            training_data_type="sql", question=question, n_results=self.n_results_sql
+        )
         # Return a list of dictionaries with only question, sql fields. The content field needs to be renamed to sql
-        return df.rename(columns={"content": "sql"})[["question", "sql"]].to_dict(orient="records")
+        return df.rename(columns={"content": "sql"})[["question", "sql"]].to_dict(
+            orient="records"
+        )
     def get_related_ddl(self, question: str, **kwargs) -> list:
-        df = self.fetch_similar_training_data(training_data_type="ddl", question=question, n_results=self.n_results_ddl)
+        df = self.fetch_similar_training_data(
+            training_data_type="ddl", question=question, n_results=self.n_results_ddl
+        )
         # Return a list of strings of the content
         return df["content"].tolist()
     def get_related_documentation(self, question: str, **kwargs) -> list:
-        df = self.fetch_similar_training_data(training_data_type="documentation", question=question, n_results=self.n_results_documentation)
+        df = self.fetch_similar_training_data(
+            training_data_type="documentation",
+            question=question,
+            n_results=self.n_results_documentation,
+        )
         # Return a list of strings of the content
         return df["content"].tolist()
     def add_question_sql(self, question: str, sql: str, **kwargs) -> str:
-        doc = {
-            "question": question,
-            "sql": sql
-        }
+        doc = {"question": question, "sql": sql}
         embedding = self.generate_embedding(str(doc))
-        return self.store_training_data(training_data_type="sql", question=question, content=sql, embedding=embedding)
+        return self.store_training_data(
+            training_data_type="sql",
+            question=question,
+            content=sql,
+            embedding=embedding,
+        )
     def add_ddl(self, ddl: str, **kwargs) -> str:
         embedding = self.generate_embedding(ddl)
-        return self.store_training_data(training_data_type="ddl", question="", content=ddl, embedding=embedding)
+        return self.store_training_data(
+            training_data_type="ddl", question="", content=ddl, embedding=embedding
+        )
     def add_documentation(self, documentation: str, **kwargs) -> str:
         embedding = self.generate_embedding(documentation)
-        return self.store_training_data(training_data_type="documentation", question="", content=documentation, embedding=embedding)
+        return self.store_training_data(
+            training_data_type="documentation",
+            question="",
+            content=documentation,
+            embedding=embedding,
+        )
     def get_training_data(self, **kwargs) -> pd.DataFrame:
-        query = f"SELECT id, training_data_type, question, content FROM `{self.table_id}`"
+        query = (
+            f"SELECT id, training_data_type, question, content FROM `{self.table_id}`"
+        )
         return self.conn.query(query).result().to_dataframe()

vanna/{google → legacy/google}/gemini_chat.py RENAMED Viewed

@@ -35,14 +35,18 @@ class GoogleGeminiChat(VannaBase):
             import vertexai
             from vertexai.generative_models import GenerativeModel
-            json_file_path = config.get("google_credentials")  # Assuming the JSON file path is provided in the config
+            json_file_path = config.get(
+                "google_credentials"
+            )  # Assuming the JSON file path is provided in the config
             if not json_file_path or not os.path.exists(json_file_path):
-                raise FileNotFoundError(f"JSON credentials file not found at: {json_file_path}")
+                raise FileNotFoundError(
+                    f"JSON credentials file not found at: {json_file_path}"
+                )
             try:
                 # Validate and set the JSON file path for GOOGLE_APPLICATION_CREDENTIALS
-                os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = json_file_path
+                os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = json_file_path
                 # Initialize VertexAI with the credentials
                 credentials, _ = google.auth.default()

vanna/{hf → legacy/hf}/hf.py RENAMED Viewed

@@ -61,7 +61,6 @@ class Hf(VannaBase):
         return self.extract_sql_query(sql)
     def submit_prompt(self, prompt, **kwargs) -> str:
         input_ids = self.tokenizer.apply_chat_template(
             prompt, add_generation_prompt=True, return_tensors="pt"
         ).to(self.model.device)

vanna/{milvus → legacy/milvus}/milvus_vector.py RENAMED Viewed

@@ -33,6 +33,7 @@ class Milvus_VectorStore(VannaBase):
                 For more models, please refer to:
                 https://milvus.io/docs/embeddings.md
     """
     def __init__(self, config=None):
         VannaBase.__init__(self, config=config)
@@ -45,7 +46,9 @@ class Milvus_VectorStore(VannaBase):
             self.embedding_function = config.get("embedding_function")
         else:
             self.embedding_function = model.DefaultEmbeddingFunction()
-        self._embedding_dim = self.embedding_function.encode_documents(["foo"])[0].shape[0]
+        self._embedding_dim = self.embedding_function.encode_documents(["foo"])[
+            0
+        ].shape[0]
         self._create_collections()
         self.n_results = config.get("n_results", 10)
@@ -54,21 +57,32 @@ class Milvus_VectorStore(VannaBase):
         self._create_ddl_collection("vannaddl")
         self._create_doc_collection("vannadoc")
     def generate_embedding(self, data: str, **kwargs) -> List[float]:
         return self.embedding_function.encode_documents(data).tolist()
     def _create_sql_collection(self, name: str):
         if not self.milvus_client.has_collection(collection_name=name):
             vannasql_schema = MilvusClient.create_schema(
                 auto_id=False,
                 enable_dynamic_field=False,
             )
-            vannasql_schema.add_field(field_name="id", datatype=DataType.VARCHAR, max_length=65535, is_primary=True)
-            vannasql_schema.add_field(field_name="text", datatype=DataType.VARCHAR, max_length=65535)
-            vannasql_schema.add_field(field_name="sql", datatype=DataType.VARCHAR, max_length=65535)
-            vannasql_schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=self._embedding_dim)
+            vannasql_schema.add_field(
+                field_name="id",
+                datatype=DataType.VARCHAR,
+                max_length=65535,
+                is_primary=True,
+            )
+            vannasql_schema.add_field(
+                field_name="text", datatype=DataType.VARCHAR, max_length=65535
+            )
+            vannasql_schema.add_field(
+                field_name="sql", datatype=DataType.VARCHAR, max_length=65535
+            )
+            vannasql_schema.add_field(
+                field_name="vector",
+                datatype=DataType.FLOAT_VECTOR,
+                dim=self._embedding_dim,
+            )
             vannasql_index_params = self.milvus_client.prepare_index_params()
             vannasql_index_params.add_index(
@@ -81,7 +95,7 @@ class Milvus_VectorStore(VannaBase):
                 collection_name=name,
                 schema=vannasql_schema,
                 index_params=vannasql_index_params,
-                consistency_level="Strong"
+                consistency_level="Strong",
             )
     def _create_ddl_collection(self, name: str):
@@ -90,9 +104,20 @@ class Milvus_VectorStore(VannaBase):
                 auto_id=False,
                 enable_dynamic_field=False,
             )
-            vannaddl_schema.add_field(field_name="id", datatype=DataType.VARCHAR, max_length=65535, is_primary=True)
-            vannaddl_schema.add_field(field_name="ddl", datatype=DataType.VARCHAR, max_length=65535)
-            vannaddl_schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=self._embedding_dim)
+            vannaddl_schema.add_field(
+                field_name="id",
+                datatype=DataType.VARCHAR,
+                max_length=65535,
+                is_primary=True,
+            )
+            vannaddl_schema.add_field(
+                field_name="ddl", datatype=DataType.VARCHAR, max_length=65535
+            )
+            vannaddl_schema.add_field(
+                field_name="vector",
+                datatype=DataType.FLOAT_VECTOR,
+                dim=self._embedding_dim,
+            )
             vannaddl_index_params = self.milvus_client.prepare_index_params()
             vannaddl_index_params.add_index(
@@ -105,7 +130,7 @@ class Milvus_VectorStore(VannaBase):
                 collection_name=name,
                 schema=vannaddl_schema,
                 index_params=vannaddl_index_params,
-                consistency_level="Strong"
+                consistency_level="Strong",
             )
     def _create_doc_collection(self, name: str):
@@ -114,9 +139,20 @@ class Milvus_VectorStore(VannaBase):
                 auto_id=False,
                 enable_dynamic_field=False,
             )
-            vannadoc_schema.add_field(field_name="id", datatype=DataType.VARCHAR, max_length=65535, is_primary=True)
-            vannadoc_schema.add_field(field_name="doc", datatype=DataType.VARCHAR, max_length=65535)
-            vannadoc_schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=self._embedding_dim)
+            vannadoc_schema.add_field(
+                field_name="id",
+                datatype=DataType.VARCHAR,
+                max_length=65535,
+                is_primary=True,
+            )
+            vannadoc_schema.add_field(
+                field_name="doc", datatype=DataType.VARCHAR, max_length=65535
+            )
+            vannadoc_schema.add_field(
+                field_name="vector",
+                datatype=DataType.FLOAT_VECTOR,
+                dim=self._embedding_dim,
+            )
             vannadoc_index_params = self.milvus_client.prepare_index_params()
             vannadoc_index_params.add_index(
@@ -129,7 +165,7 @@ class Milvus_VectorStore(VannaBase):
                 collection_name=name,
                 schema=vannadoc_schema,
                 index_params=vannadoc_index_params,
-                consistency_level="Strong"
+                consistency_level="Strong",
             )
     def add_question_sql(self, question: str, sql: str, **kwargs) -> str:
@@ -139,12 +175,7 @@ class Milvus_VectorStore(VannaBase):
         embedding = self.embedding_function.encode_documents([question])[0]
         self.milvus_client.insert(
             collection_name="vannasql",
-            data={
-                "id": _id,
-                "text": question,
-                "sql": sql,
-                "vector": embedding
-            }
+            data={"id": _id, "text": question, "sql": sql, "vector": embedding},
         )
         return _id
@@ -155,11 +186,7 @@ class Milvus_VectorStore(VannaBase):
         embedding = self.embedding_function.encode_documents([ddl])[0]
         self.milvus_client.insert(
             collection_name="vannaddl",
-            data={
-                "id": _id,
-                "ddl": ddl,
-                "vector": embedding
-            }
+            data={"id": _id, "ddl": ddl, "vector": embedding},
         )
         return _id
@@ -170,11 +197,7 @@ class Milvus_VectorStore(VannaBase):
         embedding = self.embedding_function.encode_documents([documentation])[0]
         self.milvus_client.insert(
             collection_name="vannadoc",
-            data={
-                "id": _id,
-                "doc": documentation,
-                "vector": embedding
-            }
+            data={"id": _id, "doc": documentation, "vector": embedding},
         )
         return _id
@@ -237,7 +260,7 @@ class Milvus_VectorStore(VannaBase):
             data=embeddings,
             limit=self.n_results,
             output_fields=["text", "sql"],
-            search_params=search_params
+            search_params=search_params,
         )
         res = res[0]
@@ -261,7 +284,7 @@ class Milvus_VectorStore(VannaBase):
             data=embeddings,
             limit=self.n_results,
             output_fields=["ddl"],
-            search_params=search_params
+            search_params=search_params,
         )
         res = res[0]
@@ -282,7 +305,7 @@ class Milvus_VectorStore(VannaBase):
             data=embeddings,
             limit=self.n_results,
             output_fields=["doc"],
-            search_params=search_params
+            search_params=search_params,
         )
         res = res[0]

vanna/{mock → legacy/mock}/llm.py RENAMED Viewed

	@@ -1,4 +1,3 @@
1	-
2 1	from ..base import VannaBase
3 2
4 3

vanna/legacy/mock/vectordb.py ADDED Viewed

@@ -0,0 +1,67 @@
+import pandas as pd
+from ..base import VannaBase
+class MockVectorDB(VannaBase):
+    def __init__(self, config=None):
+        pass
+    def _get_id(self, value: str, **kwargs) -> str:
+        # Hash the value and return the ID
+        return str(hash(value))
+    def add_ddl(self, ddl: str, **kwargs) -> str:
+        return self._get_id(ddl)
+    def add_documentation(self, doc: str, **kwargs) -> str:
+        return self._get_id(doc)
+    def add_question_sql(self, question: str, sql: str, **kwargs) -> str:
+        return self._get_id(question)
+    def get_related_ddl(self, question: str, **kwargs) -> list:
+        return []
+    def get_related_documentation(self, question: str, **kwargs) -> list:
+        return []
+    def get_similar_question_sql(self, question: str, **kwargs) -> list:
+        return []
+    def get_training_data(self, **kwargs) -> pd.DataFrame:
+        return pd.DataFrame(
+            {
+                "id": {
+                    0: "19546-ddl",
+                    1: "91597-sql",
+                    2: "133976-sql",
+                    3: "59851-doc",
+                    4: "73046-sql",
+                },
+                "training_data_type": {
+                    0: "ddl",
+                    1: "sql",
+                    2: "sql",
+                    3: "documentation",
+                    4: "sql",
+                },
+                "question": {
+                    0: None,
+                    1: "What are the top selling genres?",
+                    2: "What are the low 7 artists by sales?",
+                    3: None,
+                    4: "What is the total sales for each customer?",
+                },
+                "content": {
+                    0: "CREATE TABLE [Invoice]\n(\n    [InvoiceId] INTEGER  NOT NULL,\n    [CustomerId] INTEGER  NOT NULL,\n    [InvoiceDate] DATETIME  NOT NULL,\n    [BillingAddress] NVARCHAR(70),\n    [BillingCity] NVARCHAR(40),\n    [BillingState] NVARCHAR(40),\n    [BillingCountry] NVARCHAR(40),\n    [BillingPostalCode] NVARCHAR(10),\n    [Total] NUMERIC(10,2)  NOT NULL,\n    CONSTRAINT [PK_Invoice] PRIMARY KEY  ([InvoiceId]),\n    FOREIGN KEY ([CustomerId]) REFERENCES [Customer] ([CustomerId]) \n\t\tON DELETE NO ACTION ON UPDATE NO ACTION\n)",
+                    1: "SELECT g.Name AS Genre, SUM(il.Quantity) AS TotalSales\nFROM Genre g\nJOIN Track t ON g.GenreId = t.GenreId\nJOIN InvoiceLine il ON t.TrackId = il.TrackId\nGROUP BY g.GenreId, g.Name\nORDER BY TotalSales DESC;",
+                    2: "SELECT a.ArtistId, a.Name, SUM(il.Quantity) AS TotalSales\nFROM Artist a\nINNER JOIN Album al ON a.ArtistId = al.ArtistId\nINNER JOIN Track t ON al.AlbumId = t.AlbumId\nINNER JOIN InvoiceLine il ON t.TrackId = il.TrackId\nGROUP BY a.ArtistId, a.Name\nORDER BY TotalSales ASC\nLIMIT 7;",
+                    3: "This is a SQLite database. For dates rememeber to use SQLite syntax.",
+                    4: "SELECT c.CustomerId, c.FirstName, c.LastName, SUM(i.Total) AS TotalSales\nFROM Customer c\nJOIN Invoice i ON c.CustomerId = i.CustomerId\nGROUP BY c.CustomerId, c.FirstName, c.LastName;",
+                },
+            }
+        )
+    def remove_training_data(id: str, **kwargs) -> bool:
+        return True

vanna/legacy/ollama/ollama.py ADDED Viewed

@@ -0,0 +1,110 @@
+import json
+import re
+from httpx import Timeout
+from ..base import VannaBase
+from ..exceptions import DependencyError
+class Ollama(VannaBase):
+    def __init__(self, config=None):
+        try:
+            ollama = __import__("ollama")
+        except ImportError:
+            raise DependencyError(
+                "You need to install required dependencies to execute this method, run command:"
+                " \npip install ollama"
+            )
+        if not config:
+            raise ValueError("config must contain at least Ollama model")
+        if "model" not in config.keys():
+            raise ValueError("config must contain at least Ollama model")
+        self.host = config.get("ollama_host", "http://localhost:11434")
+        self.model = config["model"]
+        if ":" not in self.model:
+            self.model += ":latest"
+        self.ollama_timeout = config.get("ollama_timeout", 240.0)
+        self.ollama_client = ollama.Client(
+            self.host, timeout=Timeout(self.ollama_timeout)
+        )
+        self.keep_alive = config.get("keep_alive", None)
+        self.ollama_options = config.get("options", {})
+        self.num_ctx = self.ollama_options.get("num_ctx", 2048)
+        self.__pull_model_if_ne(self.ollama_client, self.model)
+    @staticmethod
+    def __pull_model_if_ne(ollama_client, model):
+        model_response = ollama_client.list()
+        model_lists = [
+            model_element["model"] for model_element in model_response.get("models", [])
+        ]
+        if model not in model_lists:
+            ollama_client.pull(model)
+    def system_message(self, message: str) -> any:
+        return {"role": "system", "content": message}
+    def user_message(self, message: str) -> any:
+        return {"role": "user", "content": message}
+    def assistant_message(self, message: str) -> any:
+        return {"role": "assistant", "content": message}
+    def extract_sql(self, llm_response):
+        """
+        Extracts the first SQL statement after the word 'select', ignoring case,
+        matches until the first semicolon, three backticks, or the end of the string,
+        and removes three backticks if they exist in the extracted string.
+        Args:
+        - llm_response (str): The string to search within for an SQL statement.
+        Returns:
+        - str: The first SQL statement found, with three backticks removed, or an empty string if no match is found.
+        """
+        # Remove ollama-generated extra characters
+        llm_response = llm_response.replace("\\_", "_")
+        llm_response = llm_response.replace("\\", "")
+        # Regular expression to find ```sql' and capture until '```'
+        sql = re.search(r"```sql\n((.|\n)*?)(?=;|\[|```)", llm_response, re.DOTALL)
+        # Regular expression to find 'select, with (ignoring case) and capture until ';', [ (this happens in case of mistral) or end of string
+        select_with = re.search(
+            r"(select|(with.*?as \())(.*?)(?=;|\[|```)",
+            llm_response,
+            re.IGNORECASE | re.DOTALL,
+        )
+        if sql:
+            self.log(f"Output from LLM: {llm_response} \nExtracted SQL: {sql.group(1)}")
+            return sql.group(1).replace("```", "")
+        elif select_with:
+            self.log(
+                f"Output from LLM: {llm_response} \nExtracted SQL: {select_with.group(0)}"
+            )
+            return select_with.group(0)
+        else:
+            return llm_response
+    def submit_prompt(self, prompt, **kwargs) -> str:
+        self.log(
+            f"Ollama parameters:\n"
+            f"model={self.model},\n"
+            f"options={self.ollama_options},\n"
+            f"keep_alive={self.keep_alive}"
+        )
+        self.log(f"Prompt Content:\n{json.dumps(prompt, ensure_ascii=False)}")
+        response_dict = self.ollama_client.chat(
+            model=self.model,
+            messages=prompt,
+            stream=False,
+            options=self.ollama_options,
+            keep_alive=self.keep_alive,
+        )
+        self.log(f"Ollama Response:\n{str(response_dict)}")
+        return response_dict["message"]["content"]

vanna/{openai → legacy/openai}/openai_chat.py RENAMED Viewed

@@ -65,9 +65,7 @@ class OpenAI_Chat(VannaBase):
         if kwargs.get("model", None) is not None:
             model = kwargs.get("model", None)
-            print(
-                f"Using model {model} for {num_tokens} tokens (approx)"
-            )
+            print(f"Using model {model} for {num_tokens} tokens (approx)")
             response = self.client.chat.completions.create(
                 model=model,
                 messages=prompt,
@@ -76,9 +74,7 @@ class OpenAI_Chat(VannaBase):
             )
         elif kwargs.get("engine", None) is not None:
             engine = kwargs.get("engine", None)
-            print(
-                f"Using model {engine} for {num_tokens} tokens (approx)"
-            )
+            print(f"Using model {engine} for {num_tokens} tokens (approx)")
             response = self.client.chat.completions.create(
                 engine=engine,
                 messages=prompt,

vanna 0.7.8__py3-none-any.whl → 2.0.0__py3-none-any.whl

vanna 0.7.8py3-none-any.whl → 2.0.0py3-none-any.whl