PyPI - veadk-python - Versions diffs - 0.2.7__py3-none-any.whl → 0.2.9__py3-none-any.whl - Mend

veadk-python 0.2.7py3-none-any.whl → 0.2.9py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of veadk-python might be problematic. Click here for more details.

Files changed (75) hide show

veadk/agent.py +3 -2
veadk/auth/veauth/opensearch_veauth.py +75 -0
veadk/auth/veauth/postgresql_veauth.py +75 -0
veadk/cli/cli.py +3 -1
veadk/cli/cli_eval.py +160 -0
veadk/cli/cli_prompt.py +9 -2
veadk/cli/cli_web.py +6 -1
veadk/configs/database_configs.py +43 -0
veadk/configs/model_configs.py +32 -0
veadk/consts.py +11 -4
veadk/evaluation/adk_evaluator/adk_evaluator.py +5 -2
veadk/evaluation/base_evaluator.py +95 -68
veadk/evaluation/deepeval_evaluator/deepeval_evaluator.py +23 -15
veadk/evaluation/eval_set_recorder.py +2 -2
veadk/integrations/ve_prompt_pilot/ve_prompt_pilot.py +9 -3
veadk/integrations/ve_tls/utils.py +1 -2
veadk/integrations/ve_tls/ve_tls.py +9 -5
veadk/integrations/ve_tos/ve_tos.py +542 -68
veadk/knowledgebase/backends/base_backend.py +59 -0
veadk/knowledgebase/backends/in_memory_backend.py +82 -0
veadk/knowledgebase/backends/opensearch_backend.py +136 -0
veadk/knowledgebase/backends/redis_backend.py +144 -0
veadk/knowledgebase/backends/utils.py +91 -0
veadk/knowledgebase/backends/vikingdb_knowledge_backend.py +524 -0
veadk/{database/__init__.py → knowledgebase/entry.py} +10 -2
veadk/knowledgebase/knowledgebase.py +120 -139
veadk/memory/__init__.py +22 -0
veadk/memory/long_term_memory.py +124 -41
veadk/{database/base_database.py → memory/long_term_memory_backends/base_backend.py} +10 -22
veadk/memory/long_term_memory_backends/in_memory_backend.py +65 -0
veadk/memory/long_term_memory_backends/mem0_backend.py +129 -0
veadk/memory/long_term_memory_backends/opensearch_backend.py +120 -0
veadk/memory/long_term_memory_backends/redis_backend.py +127 -0
veadk/memory/long_term_memory_backends/vikingdb_memory_backend.py +148 -0
veadk/memory/short_term_memory.py +80 -72
veadk/memory/short_term_memory_backends/base_backend.py +31 -0
veadk/memory/short_term_memory_backends/mysql_backend.py +41 -0
veadk/memory/short_term_memory_backends/postgresql_backend.py +41 -0
veadk/memory/short_term_memory_backends/sqlite_backend.py +48 -0
veadk/runner.py +12 -19
veadk/tools/builtin_tools/generate_image.py +355 -0
veadk/tools/builtin_tools/image_edit.py +56 -16
veadk/tools/builtin_tools/image_generate.py +51 -15
veadk/tools/builtin_tools/video_generate.py +41 -41
veadk/tools/builtin_tools/web_scraper.py +1 -1
veadk/tools/builtin_tools/web_search.py +7 -7
veadk/tools/load_knowledgebase_tool.py +2 -8
veadk/tracing/telemetry/attributes/extractors/llm_attributes_extractors.py +21 -3
veadk/tracing/telemetry/exporters/apmplus_exporter.py +24 -6
veadk/tracing/telemetry/exporters/cozeloop_exporter.py +2 -0
veadk/tracing/telemetry/exporters/inmemory_exporter.py +22 -8
veadk/tracing/telemetry/exporters/tls_exporter.py +2 -0
veadk/tracing/telemetry/opentelemetry_tracer.py +13 -10
veadk/tracing/telemetry/telemetry.py +66 -63
veadk/utils/misc.py +15 -0
veadk/version.py +1 -1
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/METADATA +28 -5
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/RECORD +65 -56
veadk/database/database_adapter.py +0 -533
veadk/database/database_factory.py +0 -80
veadk/database/kv/redis_database.py +0 -159
veadk/database/local_database.py +0 -62
veadk/database/relational/mysql_database.py +0 -173
veadk/database/vector/opensearch_vector_database.py +0 -263
veadk/database/vector/type.py +0 -50
veadk/database/viking/__init__.py +0 -13
veadk/database/viking/viking_database.py +0 -638
veadk/database/viking/viking_memory_db.py +0 -525
/veadk/{database/kv → knowledgebase/backends}/__init__.py +0 -0
/veadk/{database/relational → memory/long_term_memory_backends}/__init__.py +0 -0
/veadk/{database/vector → memory/short_term_memory_backends}/__init__.py +0 -0
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/WHEEL +0 -0
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/entry_points.txt +0 -0
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/licenses/LICENSE +0 -0
{veadk_python-0.2.7.dist-info → veadk_python-0.2.9.dist-info}/top_level.txt +0 -0

veadk/knowledgebase/backends/base_backend.py ADDED Viewed

@@ -0,0 +1,59 @@
+# Copyright (c) 2025 Beijing Volcano Engine Technology Co., Ltd. and/or its affiliates.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from abc import ABC, abstractmethod
+from pydantic import BaseModel
+class BaseKnowledgebaseBackend(ABC, BaseModel):
+    index: str
+    """Index or collection name of the vector storage."""
+    @abstractmethod
+    def precheck_index_naming(self) -> None:
+        """Check the index name is valid or not.
+        If index naming is not valid, raise an exception.
+        """
+    @abstractmethod
+    def add_from_directory(self, directory: str, *args, **kwargs) -> bool:
+        """Add knowledge from file path to knowledgebase"""
+    @abstractmethod
+    def add_from_files(self, files: list[str], *args, **kwargs) -> bool:
+        """Add knowledge (e.g, documents, strings, ...) to knowledgebase"""
+    @abstractmethod
+    def add_from_text(self, text: str | list[str], *args, **kwargs) -> bool:
+        """Add knowledge from text to knowledgebase"""
+    @abstractmethod
+    def search(self, *args, **kwargs) -> list:
+        """Search knowledge from knowledgebase"""
+    # Optional methods for future use:
+    # - `delete`: Delete collection or documents
+    # - `list_docs`: List original documents
+    # - `list_chunks`: List embedded document chunks
+    # def delete(self, **kwargs) -> bool:
+    #     """Delete knowledge from knowledgebase"""
+    # def list_docs(self, **kwargs) -> None:
+    #     """List original documents in knowledgebase"""
+    # def list_chunks(self, **kwargs) -> None:
+    #     """List embeded document chunks in knowledgebase"""

veadk/knowledgebase/backends/in_memory_backend.py ADDED Viewed

@@ -0,0 +1,82 @@
+# Copyright (c) 2025 Beijing Volcano Engine Technology Co., Ltd. and/or its affiliates.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from llama_index.core import Document, SimpleDirectoryReader, VectorStoreIndex
+from llama_index.core.schema import BaseNode
+from llama_index.embeddings.openai_like import OpenAILikeEmbedding
+from pydantic import Field
+from typing_extensions import Any, override
+from veadk.configs.model_configs import EmbeddingModelConfig, NormalEmbeddingModelConfig
+from veadk.knowledgebase.backends.base_backend import BaseKnowledgebaseBackend
+from veadk.knowledgebase.backends.utils import get_llama_index_splitter
+class InMemoryKnowledgeBackend(BaseKnowledgebaseBackend):
+    embedding_config: NormalEmbeddingModelConfig | EmbeddingModelConfig = Field(
+        default_factory=EmbeddingModelConfig
+    )
+    """Embedding model configs"""
+    def model_post_init(self, __context: Any) -> None:
+        self._embed_model = OpenAILikeEmbedding(
+            model_name=self.embedding_config.name,
+            api_key=self.embedding_config.api_key,
+            api_base=self.embedding_config.api_base,
+        )
+        self._vector_index = VectorStoreIndex([], embed_model=self._embed_model)
+    @override
+    def precheck_index_naming(self) -> None:
+        # Checking is not needed
+        pass
+    @override
+    def add_from_directory(self, directory: str) -> bool:
+        documents = SimpleDirectoryReader(input_dir=directory).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_files(self, files: list[str]) -> bool:
+        documents = SimpleDirectoryReader(input_files=files).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_text(self, text: str | list[str]) -> bool:
+        if isinstance(text, str):
+            documents = [Document(text=text)]
+        else:
+            documents = [Document(text=t) for t in text]
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def search(self, query: str, top_k: int = 5) -> list[str]:
+        _retriever = self._vector_index.as_retriever(similarity_top_k=top_k)
+        retrieved_nodes = _retriever.retrieve(query)
+        return [node.text for node in retrieved_nodes]
+    def _split_documents(self, documents: list[Document]) -> list[BaseNode]:
+        """Split document into chunks"""
+        nodes = []
+        for document in documents:
+            splitter = get_llama_index_splitter(document.metadata.get("file_path", ""))
+            _nodes = splitter.get_nodes_from_documents([document])
+            nodes.extend(_nodes)
+        return nodes

veadk/knowledgebase/backends/opensearch_backend.py ADDED Viewed

@@ -0,0 +1,136 @@
+# Copyright (c) 2025 Beijing Volcano Engine Technology Co., Ltd. and/or its affiliates.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import re
+from llama_index.core import (
+    Document,
+    SimpleDirectoryReader,
+    StorageContext,
+    VectorStoreIndex,
+)
+from llama_index.core.schema import BaseNode
+from llama_index.embeddings.openai_like import OpenAILikeEmbedding
+from pydantic import Field
+from typing_extensions import Any, override
+import veadk.config  # noqa E401
+from veadk.configs.database_configs import OpensearchConfig
+from veadk.configs.model_configs import EmbeddingModelConfig, NormalEmbeddingModelConfig
+from veadk.knowledgebase.backends.base_backend import BaseKnowledgebaseBackend
+from veadk.knowledgebase.backends.utils import get_llama_index_splitter
+try:
+    from llama_index.vector_stores.opensearch import (
+        OpensearchVectorClient,
+        OpensearchVectorStore,
+    )
+except ImportError:
+    raise ImportError(
+        "Please install VeADK extensions\npip install veadk-python[extensions]"
+    )
+class OpensearchKnowledgeBackend(BaseKnowledgebaseBackend):
+    opensearch_config: OpensearchConfig = Field(default_factory=OpensearchConfig)
+    """Opensearch client configs"""
+    embedding_config: EmbeddingModelConfig | NormalEmbeddingModelConfig = Field(
+        default_factory=EmbeddingModelConfig
+    )
+    """Embedding model configs"""
+    def model_post_init(self, __context: Any) -> None:
+        self.precheck_index_naming()
+        self._opensearch_client = OpensearchVectorClient(
+            endpoint=self.opensearch_config.host,
+            port=self.opensearch_config.port,
+            http_auth=(
+                self.opensearch_config.username,
+                self.opensearch_config.password,
+            ),
+            use_ssl=True,
+            verify_certs=False,
+            dim=self.embedding_config.dim,
+            index=self.index,  # collection name
+        )
+        self._vector_store = OpensearchVectorStore(client=self._opensearch_client)
+        self._storage_context = StorageContext.from_defaults(
+            vector_store=self._vector_store
+        )
+        self._embed_model = OpenAILikeEmbedding(
+            model_name=self.embedding_config.name,
+            api_key=self.embedding_config.api_key,
+            api_base=self.embedding_config.api_base,
+        )
+        self._vector_index = VectorStoreIndex.from_documents(
+            documents=[],
+            storage_context=self._storage_context,
+            embed_model=self._embed_model,
+        )
+    @override
+    def precheck_index_naming(self) -> None:
+        if not (
+            isinstance(self.index, str)
+            and not self.index.startswith(("_", "-"))
+            and self.index.islower()
+            and re.match(r"^[a-z0-9_\-.]+$", self.index)
+        ):
+            raise ValueError(
+                "The index name does not conform to the naming rules of OpenSearch"
+            )
+    @override
+    def add_from_directory(self, directory: str) -> bool:
+        documents = SimpleDirectoryReader(input_dir=directory).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_files(self, files: list[str]) -> bool:
+        documents = SimpleDirectoryReader(input_files=files).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_text(self, text: str | list[str]) -> bool:
+        if isinstance(text, str):
+            documents = [Document(text=text)]
+        else:
+            documents = [Document(text=t) for t in text]
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def search(self, query: str, top_k: int = 5) -> list[str]:
+        _retriever = self._vector_index.as_retriever(similarity_top_k=top_k)
+        retrieved_nodes = _retriever.retrieve(query)
+        return [node.text for node in retrieved_nodes]
+    def _split_documents(self, documents: list[Document]) -> list[BaseNode]:
+        """Split document into chunks"""
+        nodes = []
+        for document in documents:
+            splitter = get_llama_index_splitter(document.metadata.get("file_path", ""))
+            _nodes = splitter.get_nodes_from_documents([document])
+            nodes.extend(_nodes)
+        return nodes

veadk/knowledgebase/backends/redis_backend.py ADDED Viewed

@@ -0,0 +1,144 @@
+# Copyright (c) 2025 Beijing Volcano Engine Technology Co., Ltd. and/or its affiliates.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from llama_index.core import (
+    Document,
+    SimpleDirectoryReader,
+    StorageContext,
+    VectorStoreIndex,
+)
+from llama_index.core.schema import BaseNode
+from llama_index.embeddings.openai_like import OpenAILikeEmbedding
+from pydantic import Field
+from typing_extensions import Any, override
+import veadk.config  # noqa E401
+from veadk.configs.database_configs import RedisConfig
+from veadk.configs.model_configs import EmbeddingModelConfig, NormalEmbeddingModelConfig
+from veadk.knowledgebase.backends.base_backend import BaseKnowledgebaseBackend
+from veadk.knowledgebase.backends.utils import get_llama_index_splitter
+try:
+    from llama_index.vector_stores.redis import RedisVectorStore
+    from llama_index.vector_stores.redis.schema import (
+        RedisIndexInfo,
+        RedisVectorStoreSchema,
+    )
+    from redis import Redis
+    from redisvl.schema.fields import BaseVectorFieldAttributes
+except ImportError:
+    raise ImportError(
+        "Please install VeADK extensions\npip install veadk-python[extensions]"
+    )
+class RedisKnowledgeBackend(BaseKnowledgebaseBackend):
+    redis_config: RedisConfig = Field(default_factory=RedisConfig)
+    """Redis client configs"""
+    embedding_config: EmbeddingModelConfig | NormalEmbeddingModelConfig = Field(
+        default_factory=EmbeddingModelConfig
+    )
+    """Embedding model configs"""
+    def model_post_init(self, __context: Any) -> None:
+        # We will use `from_url` to init Redis client once the
+        # AK/SK -> STS token is ready.
+        # self._redis_client = Redis.from_url(url=...)
+        self._redis_client = Redis(
+            host=self.redis_config.host,
+            port=self.redis_config.port,
+            db=self.redis_config.db,
+            password=self.redis_config.password,
+        )
+        self._embed_model = OpenAILikeEmbedding(
+            model_name=self.embedding_config.name,
+            api_key=self.embedding_config.api_key,
+            api_base=self.embedding_config.api_base,
+        )
+        self._schema = RedisVectorStoreSchema(
+            index=RedisIndexInfo(name=self.index),
+        )
+        if "vector" in self._schema.fields:
+            vector_field = self._schema.fields["vector"]
+            if (
+                vector_field
+                and vector_field.attrs
+                and isinstance(vector_field.attrs, BaseVectorFieldAttributes)
+            ):
+                vector_field.attrs.dims = self.embedding_config.dim
+        self._vector_store = RedisVectorStore(
+            schema=self._schema,
+            redis_client=self._redis_client,
+            overwrite=True,
+            collection_name=self.index,
+        )
+        self._storage_context = StorageContext.from_defaults(
+            vector_store=self._vector_store
+        )
+        self._vector_index = VectorStoreIndex.from_documents(
+            documents=[],
+            storage_context=self._storage_context,
+            embed_model=self._embed_model,
+        )
+    @override
+    def precheck_index_naming(self) -> None:
+        # Checking is not needed
+        pass
+    @override
+    def add_from_directory(self, directory: str) -> bool:
+        documents = SimpleDirectoryReader(input_dir=directory).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_files(self, files: list[str]) -> bool:
+        documents = SimpleDirectoryReader(input_files=files).load_data()
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def add_from_text(self, text: str | list[str]) -> bool:
+        if isinstance(text, str):
+            documents = [Document(text=text)]
+        else:
+            documents = [Document(text=t) for t in text]
+        nodes = self._split_documents(documents)
+        self._vector_index.insert_nodes(nodes)
+        return True
+    @override
+    def search(self, query: str, top_k: int = 5) -> list[str]:
+        _retriever = self._vector_index.as_retriever(similarity_top_k=top_k)
+        retrieved_nodes = _retriever.retrieve(query)
+        return [node.text for node in retrieved_nodes]
+    def _split_documents(self, documents: list[Document]) -> list[BaseNode]:
+        """Split document into chunks"""
+        nodes = []
+        for document in documents:
+            splitter = get_llama_index_splitter(document.metadata.get("file_path", ""))
+            _nodes = splitter.get_nodes_from_documents([document])
+            nodes.extend(_nodes)
+        return nodes

veadk/knowledgebase/backends/utils.py ADDED Viewed

@@ -0,0 +1,91 @@
+# Copyright (c) 2025 Beijing Volcano Engine Technology Co., Ltd. and/or its affiliates.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import json
+from pathlib import Path
+from typing import Literal
+from llama_index.core.node_parser import (
+    CodeSplitter,
+    HTMLNodeParser,
+    MarkdownNodeParser,
+    SentenceSplitter,
+)
+from volcengine.auth.SignerV4 import SignerV4
+from volcengine.base.Request import Request
+from volcengine.Credentials import Credentials
+def get_llama_index_splitter(
+    file_path: str,
+) -> CodeSplitter | MarkdownNodeParser | HTMLNodeParser | SentenceSplitter:
+    suffix = Path(file_path).suffix.lower()
+    if suffix in [".py", ".js", ".java", ".cpp"]:
+        return CodeSplitter(language=suffix.strip("."))
+    elif suffix in [".md"]:
+        return MarkdownNodeParser()
+    elif suffix in [".html", ".htm"]:
+        return HTMLNodeParser()
+    else:
+        return SentenceSplitter(chunk_size=512, chunk_overlap=50)
+def build_vikingdb_knowledgebase_request(
+    path: str,
+    volcengine_access_key: str,
+    volcengine_secret_key: str,
+    method: Literal["GET", "POST", "PUT", "DELETE"] = "POST",
+    region: str = "cn-beijing",
+    params=None,
+    data=None,
+    doseq=0,
+) -> Request:
+    if params:
+        for key in params:
+            if (
+                type(params[key]) is int
+                or type(params[key]) is float
+                or type(params[key]) is bool
+            ):
+                params[key] = str(params[key])
+            elif type(params[key]) is list:
+                if not doseq:
+                    params[key] = ",".join(params[key])
+    r = Request()
+    r.set_shema("https")
+    r.set_method(method)
+    r.set_connection_timeout(10)
+    r.set_socket_timeout(10)
+    mheaders = {
+        "Accept": "application/json",
+        "Content-Type": "application/json",
+    }
+    r.set_headers(mheaders)
+    if params:
+        r.set_query(params)
+    r.set_path(path)
+    if data is not None:
+        r.set_body(json.dumps(data))
+    credentials = Credentials(
+        volcengine_access_key, volcengine_secret_key, "air", region
+    )
+    SignerV4.sign(r, credentials)
+    return r

veadk-python 0.2.7__py3-none-any.whl → 0.2.9__py3-none-any.whl

Potentially problematic release.

veadk-python 0.2.7py3-none-any.whl → 0.2.9py3-none-any.whl