PyPI - scmcp-shared - Versions diffs - 0.4.0__tar.gz → 0.6.0__tar.gz - Mend

scmcp-shared 0.4.0tar.gz → 0.6.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (52) hide show

{scmcp_shared-0.4.0 → scmcp_shared-0.6.0}/.github/workflows/test.yml RENAMED Viewed

@@ -2,13 +2,20 @@ name: test package
 on:
   push:
-    branches: [ "main" ]
+    branches: ["main"]
   pull_request:
-    branches: [ "main" ]
+    branches: ["main"]
 jobs:
   test:
     runs-on: ubuntu-latest
+    env:
+      MODEL: ${{ vars.MODEL }}
+      BASE_URL: ${{ vars.BASE_URL }}
+      API_KEY: ${{ secrets.API_KEY }}
+      EMBEDDER_MODEL: ${{ vars.EMBEDDER_MODEL }}
+      EMBEDDER_BASE_URL: ${{ vars.EMBEDDER_BASE_URL }}
+      EMBEDDER_API_KEY: ${{ secrets.EMBEDDER_API_KEY }}
     strategy:
       matrix:
         python-version: ["3.10", "3.11", "3.12", "3.13"]
@@ -31,4 +38,3 @@ jobs:
       - name: Run pytest
         run: uv run --no-sync pytest

scmcp_shared-0.6.0/.pre-commit-config.yaml ADDED Viewed

@@ -0,0 +1,29 @@
+fail_fast: true
+repos:
+  - repo: https://github.com/abravalheri/validate-pyproject
+    rev: v0.23
+    hooks:
+      - id: validate-pyproject
+  - repo: https://github.com/pre-commit/mirrors-prettier
+    rev: v3.1.0
+    hooks:
+      - id: prettier
+        types_or: [yaml, json5]
+  - repo: https://github.com/astral-sh/ruff-pre-commit
+    # Ruff version.
+    rev: v0.12.1
+    hooks:
+      # Run the linter.
+      - id: ruff-check
+        args: [--fix]
+      # Run the formatter.
+      - id: ruff-format
+  # - repo: https://github.com/northisup/pyright-pretty
+  #   rev: v0.1.0
+  #   hooks:
+  #     - id: pyright-pretty
+  #       files: ^src/|^tests/

{scmcp_shared-0.4.0 → scmcp_shared-0.6.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: scmcp_shared
-Version: 0.4.0
+Version: 0.6.0
 Summary: A shared function libray for scmcphub
 Project-URL: Homepage, http://scmcphub.org/
 Project-URL: Repository, https://github.com/scmcphub/scmcp-shared
@@ -37,12 +37,16 @@ License: BSD 3-Clause License
 License-File: LICENSE
 Keywords: AI,agent,bioinformatics,llm,mcp,model context protocol,scRNA-seq,single cell
 Requires-Python: >=3.10
+Requires-Dist: abcoder
+Requires-Dist: agno
 Requires-Dist: fastmcp>=2.7.0
 Requires-Dist: igraph
-Requires-Dist: instructor>=1.8.3
+Requires-Dist: lancedb
 Requires-Dist: leidenalg
 Requires-Dist: mcp>=1.8.0
 Requires-Dist: nest-asyncio
+Requires-Dist: openai
+Requires-Dist: requests
 Requires-Dist: scanpy
 Description-Content-Type: text/markdown

{scmcp_shared-0.4.0 → scmcp_shared-0.6.0}/pyproject.toml RENAMED Viewed

@@ -26,8 +26,12 @@ dependencies = [
     "leidenalg",
     "mcp>=1.8.0",
     "fastmcp>=2.7.0",
+    "openai",
+    "lancedb",
+    "agno",
     "nest_asyncio",
-    "instructor>=1.8.3",
+    "abcoder",
+    "requests"
 ]
 [build-system]
@@ -53,3 +57,6 @@ Documentation = "https://docs.scmcphub.org/"
 [tool.pytest.ini_options]
 asyncio_mode = "strict"
 asyncio_default_fixture_loop_scope = "function"
+[tool.ruff]
+lint.ignore = ["F403", "F405"]

scmcp_shared-0.6.0/src/scmcp_shared/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ __version__ = "0.6.0"

scmcp_shared-0.6.0/src/scmcp_shared/agent.py ADDED Viewed

@@ -0,0 +1,47 @@
+from .schema.tool import ToolList
+import os
+from agno.agent import Agent
+from agno.models.openai import OpenAILike
+from scmcp_shared.kb import load_kb
+model = OpenAILike(
+    id=os.getenv("MODEL"),
+    base_url=os.getenv("BASE_URL"),
+    api_key=os.getenv("API_KEY"),
+)
+def rag_agent(task, software=None):
+    knowledge_base = load_kb(software=software)
+    agent = Agent(
+        model=model,
+        knowledge=knowledge_base,
+        show_tool_calls=True,
+        search_knowledge=True,
+    )
+    query = f"""
+    <task>
+    {task}
+    </task>
+    查询知识库，给出一个用于解决任务的代码示例。返回结果格式为：
+    <code_example>
+        [code_example]
+    </code_example>
+    """
+    rep = agent.run(query)
+    return rep.content
+def select_tool(query):
+    agent = Agent(
+        model=model,
+        response_model=ToolList,
+        use_json_mode=True,
+        instructions="""
+        you are a bioinformatician, you are given a task and a list of tools, you need to select the most directly relevant tools to use to solve the task
+        """,
+    )
+    rep = agent.run(query)
+    return rep.content

scmcp_shared-0.6.0/src/scmcp_shared/backend.py ADDED Viewed

@@ -0,0 +1,44 @@
+from collections.abc import Iterable
+from abcoder.backend import NotebookManager
+__all__ = ["AdataManager", "NotebookManager"]
+class AdataManager:
+    def __init__(self, add_adtypes=None):
+        self.adata_dic = {"exp": {}, "activity": {}, "cnv": {}, "splicing": {}}
+        if isinstance(add_adtypes, str):
+            self.adata_dic[add_adtypes] = {}
+        elif isinstance(add_adtypes, Iterable):
+            self.adata_dic.update({adtype: {} for adtype in add_adtypes})
+        self.active_id = None
+        self.metadatWa = {}
+        self.cr_kernel = {}
+        self.cr_estimator = {}
+    def get_adata(self, sampleid=None, adtype="exp", adinfo=None):
+        if adinfo is not None:
+            kwargs = adinfo.model_dump()
+            sampleid = kwargs.get("sampleid", None)
+            adtype = kwargs.get("adtype", "exp")
+        try:
+            if self.active_id is None:
+                return None
+            sampleid = sampleid or self.active_id
+            return self.adata_dic[adtype][sampleid]
+        except KeyError as e:
+            raise KeyError(
+                f"Key {e} not found in adata_dic[{adtype}].Please check the sampleid or adtype."
+            )
+        except Exception as e:
+            raise Exception(f"fuck {e} {type(e)}")
+    def set_adata(self, adata, sampleid=None, sdtype="exp", adinfo=None):
+        if adinfo is not None:
+            kwargs = adinfo.model_dump()
+            sampleid = kwargs.get("sampleid", None)
+            sdtype = kwargs.get("adtype", "exp")
+        sampleid = sampleid or self.active_id
+        if sdtype not in self.adata_dic:
+            self.adata_dic[sdtype] = {}
+        self.adata_dic[sdtype][sampleid] = adata

{scmcp_shared-0.4.0 → scmcp_shared-0.6.0}/src/scmcp_shared/cli.py RENAMED Viewed

@@ -1,51 +1,69 @@
 import argparse
-from typing import Optional, Union, Type, Dict, Callable
-from enum import Enum
+from typing import Optional, Dict, Callable
 from .util import add_figure_route, set_env
 import os
 class MCPCLI:
     """Base class for CLI applications with support for dynamic modules and parameters."""
     def __init__(self, name: str, help_text: str, mcp=None, manager=None):
         self.name = name
         self.mcp = mcp
         self.manager = manager
-        self.parser = argparse.ArgumentParser(
-            description=help_text,
-            prog=name
-        )
+        self.parser = argparse.ArgumentParser(description=help_text, prog=name)
         self.subcommands: Dict[str, tuple[argparse.ArgumentParser, Callable]] = {}
         self._setup_commands()
     def _setup_commands(self):
         """Setup the main commands for the CLI."""
-        subparsers = self.parser.add_subparsers(dest='command', help='Available commands')
-        run_parser = subparsers.add_parser('run', help='Start the server with the specified configuration')
+        subparsers = self.parser.add_subparsers(
+            dest="command", help="Available commands"
+        )
+        run_parser = subparsers.add_parser(
+            "run", help="Start the server with the specified configuration"
+        )
         self._setup_run_command(run_parser)
-        self.subcommands['run'] = (run_parser, self._run_command)
+        self.subcommands["run"] = (run_parser, self._run_command)
     def _setup_run_command(self, parser: argparse.ArgumentParser):
         """Setup run command arguments."""
-        parser.add_argument('-t', '--transport', default="stdio",
-                          choices=["stdio", "shttp", "sse"],
-                          help='specify transport type')
-        parser.add_argument('-p', '--port', type=int, default=8000, help='transport port')
-        parser.add_argument('--host', default='127.0.0.1', help='transport host')
-        parser.add_argument('-f', '--forward', help='forward request to another server')
-        parser.add_argument('-wd', '--working-dir', default=".", help='working directory')
-        parser.add_argument('--tool-mode', choices=["auto", "normal"], default="normal", help='tool selection mode')
-        parser.add_argument('--log-file', help='log file path, use stdout if None')
-    def add_command(self, name: str, help_text: str, handler: Callable) -> argparse.ArgumentParser:
+        parser.add_argument(
+            "-t",
+            "--transport",
+            default="stdio",
+            choices=["stdio", "shttp", "sse"],
+            help="specify transport type",
+        )
+        parser.add_argument(
+            "-p", "--port", type=int, default=8000, help="transport port"
+        )
+        parser.add_argument("--host", default="127.0.0.1", help="transport host")
+        parser.add_argument("-f", "--forward", help="forward request to another server")
+        parser.add_argument(
+            "-wd", "--working-dir", default=".", help="working directory"
+        )
+        parser.add_argument(
+            "--run-mode", choices=["tool", "code"], default="code", help="run mode"
+        )
+        parser.add_argument(
+            "--tool-mode",
+            choices=["auto", "normal"],
+            default="normal",
+            help="tool selection mode",
+        )
+        parser.add_argument("--log-file", help="log file path, use stdout if None")
+    def add_command(
+        self, name: str, help_text: str, handler: Callable
+    ) -> argparse.ArgumentParser:
         """add new subcommand
         Args:
             name: subcommand name
             help_text: help text
             handler: handler function
         Returns:
             ArgumentParser: parser for the subcommand
         """
@@ -53,24 +71,24 @@ class MCPCLI:
         parser = subparsers.add_parser(name, help=help_text)
         self.subcommands[name] = (parser, handler)
         return parser
     def get_command_parser(self, name: str) -> Optional[argparse.ArgumentParser]:
         """get the parser for the subcommand
         Args:
             name: subcommand name
         Returns:
             ArgumentParser: parser for the subcommand, return None if the subcommand does not exist
         """
         if name in self.subcommands:
             return self.subcommands[name][0]
         return None
     def _run_command(self, args):
         """Start the server with the specified configuration."""
         os.chdir(args.working_dir)
-        if hasattr(args, 'module'):
+        if hasattr(args, "module"):
             if "all" in args.module:
                 modules = None
             elif isinstance(args.module, list) and bool(args.module):
@@ -78,16 +96,31 @@ class MCPCLI:
         else:
             modules = None
         if self.manager is not None:
-            self.mcp = self.manager(self.name, include_modules=modules).mcp
-            all_tools = self.mcp._tool_manager._tools
-            auto_tools = {tool: all_tools[tool] for tool in all_tools if all_tools[tool].name in ["search_tool", "run_tool"]}
-            if args.tool_mode == "auto":
-                all_tools = self.mcp._tool_manager._tools
-                self.mcp._tool_manager._all_tools = all_tools
-                self.mcp._tool_manager._tools = auto_tools
+            from .backend import NotebookManager, AdataManager
+            if args.run_mode == "code":
+                backend = NotebookManager
+                self.mcp = self.manager(
+                    self.name, include_tags=["nb", "rag"], backend=backend
+                ).mcp
             else:
-                for name in auto_tools:
-                    self.mcp._tool_manager.remove_tool(name)
+                backend = AdataManager
+                self.mcp = self.manager(
+                    self.name, include_modules=modules, backend=backend
+                ).mcp
+                all_tools = self.mcp._tool_manager._tools
+                auto_tools = {
+                    tool: all_tools[tool]
+                    for tool in all_tools
+                    if "auto" in all_tools[tool].tags
+                }
+                if args.tool_mode == "auto":
+                    all_tools = self.mcp._tool_manager._tools
+                    self.mcp._tool_manager._all_tools = all_tools
+                    self.mcp._tool_manager._tools = auto_tools
+                else:
+                    for name in auto_tools:
+                        self.mcp._tool_manager.remove_tool(name)
         elif self.mcp is not None:
             pass
         else:
@@ -98,19 +131,15 @@ class MCPCLI:
     def run_mcp(self, log_file, forward, transport, host, port):
         set_env(log_file, forward, transport, host, port)
         from .logging_config import setup_logger
         setup_logger(log_file)
         if transport == "stdio":
             self.mcp.run()
         elif transport in ["sse", "shttp"]:
             transport = "streamable-http" if transport == "shttp" else transport
             add_figure_route(self.mcp)
-            self.mcp.run(
-                transport=transport,
-                host=host,
-                port=port,
-                log_level="info"
-            )
+            self.mcp.run(transport=transport, host=host, port=port, log_level="info")
     def run(self):
         """Run the CLI application."""
         args = self.parser.parse_args()

scmcp_shared-0.6.0/src/scmcp_shared/kb.py ADDED Viewed

@@ -0,0 +1,139 @@
+from agno.document.chunking.agentic import AgenticChunking
+from agno.embedder.openai import OpenAIEmbedder
+from agno.models.deepseek import DeepSeek
+from agno.vectordb.lancedb import LanceDb
+from agno.knowledge.agent import AgentKnowledge
+import importlib.resources
+import os
+import requests
+import zipfile
+import tempfile
+import shutil
+from pathlib import Path
+import logging
+logger = logging.getLogger(__name__)
+embedder_id = os.getenv("EMBEDDER_MODEL")
+embedder_api_key = os.getenv("EMBEDDER_API_KEY")
+embedder_base_url = os.getenv("EMBEDDER_BASE_URL")
+model_id = os.getenv("MODEL")
+model_api_key = os.getenv("API_KEY")
+model_base_url = os.getenv("BASE_URL")
+# 配置信息
+config = {
+    "local_dir": "vector_db",
+    "huggingface_url": "https://huggingface.co/datasets/huangshing/scmcp_vector_db/resolve/main/vector_db.zip",
+}
+def download_vector_db(source="huggingface"):
+    """
+    下载向量数据库文件
+    Args:
+        source: 下载源 ("huggingface" 或 "github")
+    """
+    # 获取本地存储路径
+    package_path = importlib.resources.path("scmcp_shared", "")
+    local_dir = Path(package_path) / config["local_dir"]
+    local_dir.mkdir(exist_ok=True)
+    # 检查是否已存在
+    if (local_dir / "scmcp.lance").exists():
+        logger.info("Vector database already exists locally")
+        return str(local_dir)
+    logger.info(f"Downloading vector database from {source}...")
+    # 创建临时目录用于下载和解压
+    with tempfile.TemporaryDirectory() as temp_dir:
+        temp_path = Path(temp_dir)
+        zip_path = temp_path / "vector_db.zip"
+        try:
+            # 下载文件
+            if source == "huggingface":
+                url = config["huggingface_url"]
+            else:
+                raise ValueError(f"Unsupported source: {source}")
+            logger.info(f"Downloading from: {url}")
+            response = requests.get(url, stream=True)
+            response.raise_for_status()
+            with open(zip_path, "wb") as f:
+                for chunk in response.iter_content(chunk_size=8192):
+                    f.write(chunk)
+            # 解压文件
+            logger.info("Extracting downloaded archive...")
+            _extract_archive(zip_path, local_dir)
+            logger.info(f"Vector database downloaded and extracted to: {local_dir}")
+            return str(local_dir)
+        except requests.RequestException as e:
+            raise RuntimeError(f"Failed to download vector database: {e}")
+        except Exception as e:
+            raise RuntimeError(f"Failed to process vector database: {e}")
+def _extract_archive(archive_path, extract_dir):
+    """解压归档文件"""
+    with zipfile.ZipFile(archive_path, "r") as zip_ref:
+        zip_ref.extractall(extract_dir)
+    # 如果解压后只有一个子目录，移动内容到目标目录
+    extracted_items = list(Path(extract_dir).iterdir())
+    if len(extracted_items) == 1 and extracted_items[0].is_dir():
+        subdir = extracted_items[0]
+        for item in subdir.iterdir():
+            shutil.move(str(item), str(extract_dir / item.name))
+        subdir.rmdir()
+def load_kb(software=None, auto_download=True, download_source="huggingface"):
+    """
+    加载知识库
+    Args:
+        software: 软件名称
+        auto_download: 是否自动下载向量数据库
+        download_source: 下载源 ("huggingface" 或 "github")
+    """
+    # 获取向量数据库路径
+    try:
+        vector_db_path = importlib.resources.path("scmcp_shared", "vector_db")
+    except FileNotFoundError:
+        if auto_download:
+            logger.info("Vector database not found in package, attempting download...")
+            vector_db_path = download_vector_db(download_source)
+        else:
+            raise FileNotFoundError(
+                "Vector database not found. Set auto_download=True to download automatically, "
+                "or manually place the vector database in the scmcp_shared package."
+            )
+    vector_db = LanceDb(
+        table_name=software,
+        uri=vector_db_path,
+        embedder=OpenAIEmbedder(
+            id=embedder_id,
+            base_url=embedder_base_url,
+            api_key=embedder_api_key,
+        ),
+    )
+    model = DeepSeek(
+        id=model_id,
+        base_url=model_base_url,
+        api_key=model_api_key,
+    )
+    knowledge_base = AgentKnowledge(
+        chunking_strategy=AgenticChunking(model=model),
+        vector_db=vector_db,
+    )
+    return knowledge_base

{scmcp_shared-0.4.0 → scmcp_shared-0.6.0}/src/scmcp_shared/logging_config.py RENAMED Viewed

@@ -1,18 +1,17 @@
 import logging
 import sys
-import os
 from .util import get_env
-def setup_logger(name="sc-mcp-server", log_file=None):
+def setup_logger(name="sc-mcp-server", log_file=None):
     logger = logging.getLogger(name)
     logger.setLevel(logging.INFO)
     if logger.handlers:
         return logger
     formatter = logging.Formatter(
-        '%(asctime)s - %(name)s - %(levelname)s - %(message)s',
-        '%Y-%m-%d %H:%M:%S'
+        "%(asctime)s - %(name)s - %(levelname)s - %(message)s", "%Y-%m-%d %H:%M:%S"
     )
     if log_file is None:
         log_file = get_env("LOG_FILE")
@@ -20,12 +19,11 @@ def setup_logger(name="sc-mcp-server", log_file=None):
         log_handler = logging.FileHandler(log_file)
         log_handler.setFormatter(formatter)
         logger.addHandler(log_handler)
         logger.info(f"logging output: {log_file}")
     else:
         log_handler = logging.StreamHandler(sys.stdout)
         log_handler.setFormatter(formatter)
         logger.addHandler(log_handler)
-        logger.info(f"loggin file output: stdout")
+        logger.info("loggin file output: stdout")
     return logger

scmcp-shared 0.4.0__tar.gz → 0.6.0__tar.gz

scmcp-shared 0.4.0tar.gz → 0.6.0tar.gz