PyPI - aiagents4pharma - Versions diffs - 1.28.0__py3-none-any.whl → 1.29.0__py3-none-any.whl - Mend

aiagents4pharma 1.28.0py3-none-any.whl → 1.29.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (41) hide show

aiagents4pharma/talk2scholars/tools/s2/multi_paper_rec.py CHANGED Viewed

@@ -16,6 +16,7 @@ from langchain_core.tools.base import InjectedToolCallId
 from langgraph.types import Command
 from pydantic import BaseModel, Field
+# pylint: disable=R0914,R0912,R0915
 # Configure logging
 logging.basicConfig(level=logging.INFO)
@@ -26,7 +27,7 @@ class MultiPaperRecInput(BaseModel):
     """Input schema for multiple paper recommendations tool."""
     paper_ids: List[str] = Field(
-        description=("List of Semantic Scholar Paper IDs to get recommendations for")
+        description="List of Semantic Scholar Paper IDs to get recommendations for"
     )
     limit: int = Field(
         default=2,
@@ -44,14 +45,6 @@ class MultiPaperRecInput(BaseModel):
     model_config = {"arbitrary_types_allowed": True}
-# Load hydra configuration
-with hydra.initialize(version_base=None, config_path="../../configs"):
-    cfg = hydra.compose(
-        config_name="config", overrides=["tools/multi_paper_recommendation=default"]
-    )
-    cfg = cfg.tools.multi_paper_recommendation
 @tool(args_schema=MultiPaperRecInput, parse_docstring=True)
 def get_multi_paper_recommendations(
     paper_ids: List[str],
@@ -73,7 +66,14 @@ def get_multi_paper_recommendations(
     Returns:
         Dict[str, Any]: The recommendations and related information.
     """
-    logging.info(
+    # Load hydra configuration
+    with hydra.initialize(version_base=None, config_path="../../configs"):
+        cfg = hydra.compose(
+            config_name="config", overrides=["tools/multi_paper_recommendation=default"]
+        )
+        cfg = cfg.tools.multi_paper_recommendation
+        logger.info("Loaded configuration for multi-paper recommendation tool")
+    logger.info(
         "Starting multi-paper recommendations search with paper IDs: %s", paper_ids
     )
@@ -89,45 +89,61 @@ def get_multi_paper_recommendations(
     if year:
         params["year"] = year
-    # Getting recommendations
-    response = requests.post(
-        endpoint,
-        headers=headers,
-        params=params,
-        data=json.dumps(payload),
-        timeout=cfg.request_timeout,
-    )
-    logging.info(
+    # Wrap API call in try/except to catch connectivity issues and validate response format
+    try:
+        response = requests.post(
+            endpoint,
+            headers=headers,
+            params=params,
+            data=json.dumps(payload),
+            timeout=cfg.request_timeout,
+        )
+        response.raise_for_status()  # Raises HTTPError for bad responses
+    except requests.exceptions.RequestException as e:
+        logger.error(
+            "Failed to connect to Semantic Scholar API for multi-paper recommendations: %s",
+            e,
+        )
+        raise RuntimeError(
+            "Failed to connect to Semantic Scholar API. Please retry the same query."
+        ) from e
+    logger.info(
         "API Response Status for multi-paper recommendations: %s", response.status_code
     )
+    logger.info("Request params: %s", params)
     data = response.json()
-    recommendations = data.get("recommendedPapers", [])
+    # Check for expected data format
+    if "recommendedPapers" not in data:
+        logger.error("Unexpected API response format: %s", data)
+        raise RuntimeError(
+            "Unexpected response from Semantic Scholar API. The results could not be "
+            "retrieved due to an unexpected format. "
+            "Please modify your search query and try again."
+        )
+    recommendations = data.get("recommendedPapers", [])
     if not recommendations:
-        return Command(
-            update={  # Place 'messages' inside 'update'
-                "messages": [
-                    ToolMessage(
-                        content="No recommendations found based on multiple papers.",
-                        tool_call_id=tool_call_id,
-                    )
-                ]
-            }
+        logger.error(
+            "No recommendations returned from API for paper IDs: %s", paper_ids
+        )
+        raise RuntimeError(
+            "No recommendations were found for your query. Consider refining your search "
+            "by using more specific keywords or different terms."
         )
     # Create a dictionary to store the papers
     filtered_papers = {
         paper["paperId"]: {
-            # "semantic_scholar_id": paper["paperId"],  # Store Semantic Scholar ID
+            "paper_id": paper["paperId"],
             "Title": paper.get("title", "N/A"),
             "Abstract": paper.get("abstract", "N/A"),
             "Year": paper.get("year", "N/A"),
             "Citation Count": paper.get("citationCount", "N/A"),
             "URL": paper.get("url", "N/A"),
-            # "arXiv_ID": paper.get("externalIds", {}).get(
-            #     "ArXiv", "N/A"
-            # ),  # Extract arXiv ID
+            "arxiv_id": paper.get("externalIds", {}).get("ArXiv", "N/A"),
         }
         for paper in recommendations
         if paper.get("title") and paper.get("authors")
@@ -156,7 +172,7 @@ def get_multi_paper_recommendations(
     return Command(
         update={
-            "multi_papers": filtered_papers,  # Now sending the dictionary directly
+            "multi_papers": filtered_papers,  # Sending the dictionary directly
             "last_displayed_papers": "multi_papers",
             "messages": [
                 ToolMessage(

aiagents4pharma/talk2scholars/tools/s2/retrieve_semantic_scholar_paper_id.py CHANGED Viewed

@@ -19,14 +19,6 @@ from pydantic import Field
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# Load hydra configuration
-with hydra.initialize(version_base=None, config_path="../../configs"):
-    cfg = hydra.compose(
-        config_name="config",
-        overrides=["tools/retrieve_semantic_scholar_paper_id=default"],
-    )
-    cfg = cfg.tools.retrieve_semantic_scholar_paper_id
 @tool("retrieve_semantic_scholar_paper_id", parse_docstring=True)
 def retrieve_semantic_scholar_paper_id(
@@ -49,6 +41,14 @@ def retrieve_semantic_scholar_paper_id(
     Returns:
         ToolMessage: A message containing the paper ID.
     """
+    # Load hydra configuration
+    with hydra.initialize(version_base=None, config_path="../../configs"):
+        cfg = hydra.compose(
+            config_name="config",
+            overrides=["tools/retrieve_semantic_scholar_paper_id=default"],
+        )
+        cfg = cfg.tools.retrieve_semantic_scholar_paper_id
+        logger.info("Loaded configuration for Semantic Scholar paper ID retrieval tool")
     logger.info("Retrieving ID of paper with title: %s", paper_title)
     endpoint = cfg.api_endpoint
     params = {

aiagents4pharma/talk2scholars/tools/s2/search.py CHANGED Viewed

@@ -37,12 +37,6 @@ class SearchInput(BaseModel):
     tool_call_id: Annotated[str, InjectedToolCallId]
-# Load hydra configuration
-with hydra.initialize(version_base=None, config_path="../../configs"):
-    cfg = hydra.compose(config_name="config", overrides=["tools/search=default"])
-    cfg = cfg.tools.search
 @tool("search_tool", args_schema=SearchInput, parse_docstring=True)
 def search_tool(
     query: str,
@@ -56,13 +50,18 @@ def search_tool(
     Args:
         query (str): The search query string to find academic papers.
         tool_call_id (Annotated[str, InjectedToolCallId]): The tool call ID.
-        limit (int, optional): The maximum number of results to return. Defaults to 2.
+        limit (int, optional): The maximum number of results to return. Defaults to 5.
         year (str, optional): Year range for papers.
         Supports formats like "2024-", "-2024", "2024:2025". Defaults to None.
     Returns:
         The number of papers found on Semantic Scholar.
     """
+    # Load hydra configuration
+    with hydra.initialize(version_base=None, config_path="../../configs"):
+        cfg = hydra.compose(config_name="config", overrides=["tools/search=default"])
+        cfg = cfg.tools.search
+        logger.info("Loaded configuration for search tool")
     logger.info("Searching for papers on %s", query)
     endpoint = cfg.api_endpoint
     params = {
@@ -75,33 +74,47 @@ def search_tool(
     if year:
         params["year"] = year
-    response = requests.get(endpoint, params=params, timeout=10)
+    # Wrap API call in try/except to catch connectivity issues
+    try:
+        response = requests.get(endpoint, params=params, timeout=10)
+        response.raise_for_status()  # Raises HTTPError for bad responses
+    except requests.exceptions.RequestException as e:
+        logger.error("Failed to connect to Semantic Scholar API: %s", e)
+        raise RuntimeError(
+            "Failed to connect to Semantic Scholar API. Please retry the same query."
+        ) from e
     data = response.json()
+    # Check for expected data format
+    if "data" not in data:
+        logger.error("Unexpected API response format: %s", data)
+        raise RuntimeError(
+            "Unexpected response from Semantic Scholar API. The results could not be "
+            "retrieved due to an unexpected format. "
+            "Please modify your search query and try again."
+        )
     papers = data.get("data", [])
-    logger.info("Received %d papers", len(papers))
     if not papers:
-        return Command(
-            update={  # Place 'messages' inside 'update'
-                "messages": [
-                    ToolMessage(
-                        content="No papers found. Please try a different search query.",
-                        tool_call_id=tool_call_id,
-                    )
-                ]
-            }
+        logger.error(
+            "No papers returned from Semantic Scholar API for query: %s", query
         )
+        raise RuntimeError(
+            "No papers were found for your query. Consider refining your search "
+            "by using more specific keywords or different terms."
+        )
     # Create a dictionary to store the papers
     filtered_papers = {
         paper["paperId"]: {
-            # "semantic_scholar_id": paper["paperId"],  # Store Semantic Scholar ID
+            "paper_id": paper["paperId"],
             "Title": paper.get("title", "N/A"),
             "Abstract": paper.get("abstract", "N/A"),
             "Year": paper.get("year", "N/A"),
             "Citation Count": paper.get("citationCount", "N/A"),
             "URL": paper.get("url", "N/A"),
-            # "arXiv_ID": paper.get("externalIds", {}).get(
-            #     "ArXiv", "N/A"
-            # ),  # Extract arXiv ID
+            "arxiv_id": paper.get("externalIds", {}).get("ArXiv", "N/A"),
         }
         for paper in papers
         if paper.get("title") and paper.get("authors")
@@ -129,7 +142,7 @@ def search_tool(
     return Command(
         update={
-            "papers": filtered_papers,  # Now sending the dictionary directly
+            "papers": filtered_papers,  # Sending the dictionary directly
             "last_displayed_papers": "papers",
             "messages": [
                 ToolMessage(

aiagents4pharma/talk2scholars/tools/s2/single_paper_rec.py CHANGED Viewed

@@ -40,14 +40,6 @@ class SinglePaperRecInput(BaseModel):
     model_config = {"arbitrary_types_allowed": True}
-# Load hydra configuration
-with hydra.initialize(version_base=None, config_path="../../configs"):
-    cfg = hydra.compose(
-        config_name="config", overrides=["tools/single_paper_recommendation=default"]
-    )
-    cfg = cfg.tools.single_paper_recommendation
 @tool(args_schema=SinglePaperRecInput, parse_docstring=True)
 def get_single_paper_recommendations(
     paper_id: str,
@@ -56,19 +48,27 @@ def get_single_paper_recommendations(
     year: Optional[str] = None,
 ) -> Command[Any]:
     """
-    Get recommendations for on a single paper using its Semantic Scholar ID.
+    Get recommendations for a single paper using its Semantic Scholar ID.
     No other ID types are supported.
     Args:
         paper_id (str): The Semantic Scholar Paper ID to get recommendations for.
         tool_call_id (Annotated[str, InjectedToolCallId]): The tool call ID.
-        limit (int, optional): The maximum number of recommendations to return. Defaults to 2.
+        limit (int, optional): The maximum number of recommendations to return. Defaults to 5.
         year (str, optional): Year range for papers.
         Supports formats like "2024-", "-2024", "2024:2025". Defaults to None.
     Returns:
         Dict[str, Any]: The recommendations and related information.
     """
+    # Load hydra configuration
+    with hydra.initialize(version_base=None, config_path="../../configs"):
+        cfg = hydra.compose(
+            config_name="config",
+            overrides=["tools/single_paper_recommendation=default"],
+        )
+        cfg = cfg.tools.single_paper_recommendation
+        logger.info("Loaded configuration for single paper recommendation tool")
     logger.info(
         "Starting single paper recommendations search with paper ID: %s", paper_id
     )
@@ -84,48 +84,54 @@ def get_single_paper_recommendations(
     if year:
         params["year"] = year
-    response = requests.get(endpoint, params=params, timeout=cfg.request_timeout)
-    data = response.json()
-    response = requests.get(endpoint, params=params, timeout=10)
-    # print(f"API Response Status: {response.status_code}")
-    logging.info(
+    # Wrap API call in try/except to catch connectivity issues and check response format
+    try:
+        response = requests.get(endpoint, params=params, timeout=cfg.request_timeout)
+        response.raise_for_status()  # Raises HTTPError for bad responses
+    except requests.exceptions.RequestException as e:
+        logger.error(
+            "Failed to connect to Semantic Scholar API for recommendations: %s", e
+        )
+        raise RuntimeError(
+            "Failed to connect to Semantic Scholar API. Please retry the same query."
+        ) from e
+    logger.info(
         "API Response Status for recommendations of paper %s: %s",
         paper_id,
         response.status_code,
     )
-    if response.status_code != 200:
-        raise ValueError("Invalid paper ID or API error.")
-    # print(f"Request params: {params}")
-    logging.info("Request params: %s", params)
+    logger.info("Request params: %s", params)
     data = response.json()
-    recommendations = data.get("recommendedPapers", [])
+    # Check for expected data format
+    if "recommendedPapers" not in data:
+        logger.error("Unexpected API response format: %s", data)
+        raise RuntimeError(
+            "Unexpected response from Semantic Scholar API. The results could not be "
+            "retrieved due to an unexpected format. "
+            "Please modify your search query and try again."
+        )
+    recommendations = data.get("recommendedPapers", [])
     if not recommendations:
-        return Command(
-            update={
-                "papers": {},
-                "messages": [
-                    ToolMessage(
-                        content=f"No recommendations found for {paper_id}.",
-                        tool_call_id=tool_call_id,
-                    )
-                ],
-            }
+        logger.error("No recommendations returned from API for paper: %s", paper_id)
+        raise RuntimeError(
+            "No recommendations were found for your query. Consider refining your search "
+            "by using more specific keywords or different terms."
         )
     # Extract paper ID and title from recommendations
     filtered_papers = {
         paper["paperId"]: {
-            # "semantic_scholar_id": paper["paperId"],  # Store Semantic Scholar ID
+            "paper_id": paper["paperId"],
             "Title": paper.get("title", "N/A"),
             "Abstract": paper.get("abstract", "N/A"),
             "Year": paper.get("year", "N/A"),
             "Citation Count": paper.get("citationCount", "N/A"),
             "URL": paper.get("url", "N/A"),
-            # "arXiv_ID": paper.get("externalIds", {}).get(
-            #     "ArXiv", "N/A"
-            # ),  # Extract arXiv ID
+            "arxiv_id": paper.get("externalIds", {}).get("ArXiv", "N/A"),
         }
         for paper in recommendations
         if paper.get("title") and paper.get("authors")
@@ -143,10 +149,10 @@ def get_single_paper_recommendations(
     logger.info("Filtered %d papers", len(filtered_papers))
     content = (
-        "Recommendations based on single paper were successful. "
-        "Papers are attached as an artifact."
+        "Recommendations based on the single paper were successful. "
+        "Papers are attached as an artifact. "
+        "Here is a summary of the recommendations:\n"
     )
-    content += " Here is a summary of the recommendations:\n"
     content += f"Number of papers found: {len(filtered_papers)}\n"
     content += f"Query Paper ID: {paper_id}\n"
     content += f"Year: {year}\n" if year else ""
@@ -154,7 +160,7 @@ def get_single_paper_recommendations(
     return Command(
         update={
-            "papers": filtered_papers,  # Now sending the dictionary directly
+            "papers": filtered_papers,  # Sending the dictionary directly
             "last_displayed_papers": "papers",
             "messages": [
                 ToolMessage(

aiagents4pharma/talk2scholars/tools/zotero/__init__.py CHANGED Viewed

@@ -3,3 +3,5 @@ Import statements
 """
 from . import zotero_read
+from . import zotero_write
+from . import utils

aiagents4pharma/talk2scholars/tools/zotero/utils/__init__.py ADDED Viewed

@@ -0,0 +1,5 @@
+"""
+Import statements
+"""
+from . import zotero_path

aiagents4pharma/talk2scholars/tools/zotero/utils/zotero_path.py ADDED Viewed

@@ -0,0 +1,63 @@
+#!/usr/bin/env python3
+"""
+Utility functions for Zotero tools.
+"""
+import logging
+# Configure logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+def get_item_collections(zot):
+    """
+    Fetch all Zotero collections and map item keys to their full collection paths.
+    Args:
+        zot (Zotero): An initialized Zotero client.
+    Returns:
+        dict: A dictionary mapping item keys to a list of full collection paths.
+    """
+    logger.info("Fetching Zotero collections...")
+    # Fetch all collections
+    collections = zot.collections()
+    # Create mappings: collection key → name and collection key → parent key
+    collection_map = {col["key"]: col["data"]["name"] for col in collections}
+    parent_map = {
+        col["key"]: col["data"].get("parentCollection") for col in collections
+    }
+    # Build full paths for collections
+    def build_collection_path(col_key):
+        path = []
+        while col_key:
+            path.insert(0, collection_map.get(col_key, "Unknown"))
+            col_key = parent_map.get(col_key)
+        return "/" + "/".join(path)  # Convert to "/path/to/collection"
+    collection_paths = {key: build_collection_path(key) for key in collection_map}
+    # Manually create an item-to-collection mapping with full paths
+    item_to_collections = {}
+    for collection in collections:
+        collection_key = collection["key"]
+        collection_items = zot.collection_items(
+            collection_key
+        )  # Fetch items in the collection
+        for item in collection_items:
+            item_key = item["data"]["key"]
+            if item_key in item_to_collections:
+                item_to_collections[item_key].append(collection_paths[collection_key])
+            else:
+                item_to_collections[item_key] = [collection_paths[collection_key]]
+    logger.info("Successfully mapped items to collection paths.")
+    return item_to_collections

aiagents4pharma/talk2scholars/tools/zotero/zotero_read.py CHANGED Viewed

@@ -13,6 +13,11 @@ from langchain_core.tools import tool
 from langchain_core.tools.base import InjectedToolCallId
 from langgraph.types import Command
 from pydantic import BaseModel, Field
+from aiagents4pharma.talk2scholars.tools.zotero.utils.zotero_path import (
+    get_item_collections,
+)
+# pylint: disable=R0914,R0912,R0915
 # Configure logging
 logging.basicConfig(level=logging.INFO)
@@ -27,7 +32,7 @@ class ZoteroSearchInput(BaseModel):
     )
     only_articles: bool = Field(
         default=True,
-        description="Whether to only search for journal articles/" "conference papers.",
+        description="Whether to only search for journal articles/conference papers.",
     )
     limit: int = Field(
         default=2, description="Maximum number of results to return", ge=1, le=100
@@ -35,12 +40,6 @@ class ZoteroSearchInput(BaseModel):
     tool_call_id: Annotated[str, InjectedToolCallId]
-# Load hydra configuration
-with hydra.initialize(version_base=None, config_path="../../configs"):
-    cfg = hydra.compose(config_name="config", overrides=["tools/zotero_read=default"])
-    cfg = cfg.tools.zotero_read
 @tool(args_schema=ZoteroSearchInput, parse_docstring=True)
 def zotero_search_tool(
     query: str,
@@ -59,22 +58,55 @@ def zotero_search_tool(
     Returns:
         Dict[str, Any]: The search results and related information.
     """
-    logger.info(
-        "Searching Zotero for query: '%s' (only_articles: %s, limit: %d)",
-        query,
-        only_articles,
-        limit,
-    )
+    # Load hydra configuration
+    with hydra.initialize(version_base=None, config_path="../../configs"):
+        cfg = hydra.compose(
+            config_name="config", overrides=["tools/zotero_read=default"]
+        )
+        logger.info("Loaded configuration for Zotero search tool")
+        cfg = cfg.tools.zotero_read
+        logger.info(
+            "Searching Zotero for query: '%s' (only_articles: %s, limit: %d)",
+            query,
+            only_articles,
+            limit,
+        )
     # Initialize Zotero client
     zot = zotero.Zotero(cfg.user_id, cfg.library_type, cfg.api_key)
-    # Get items matching the query
-    items = zot.items(q=query, limit=min(limit, cfg.zotero.max_limit))
+    # Fetch collection mapping once
+    item_to_collections = get_item_collections(zot)
+    # If the query is empty, fetch all items (up to max_limit), otherwise use the query
+    try:
+        if query.strip() == "":
+            logger.info(
+                "Empty query provided, fetching all items up to max_limit: %d",
+                cfg.zotero.max_limit,
+            )
+            items = zot.items(limit=cfg.zotero.max_limit)
+        else:
+            items = zot.items(q=query, limit=min(limit, cfg.zotero.max_limit))
+    except Exception as e:
+        logger.error("Failed to fetch items from Zotero: %s", e)
+        raise RuntimeError(
+            "Failed to fetch items from Zotero. Please retry the same query."
+        ) from e
     logger.info("Received %d items from Zotero", len(items))
+    if not items:
+        logger.error("No items returned from Zotero for query: '%s'", query)
+        raise RuntimeError(
+            "No items returned from Zotero. Please retry the same query."
+        )
     # Define filter criteria
     filter_item_types = cfg.zotero.filter_item_types if only_articles else []
+    filter_excluded_types = (
+        cfg.zotero.filter_excluded_types
+    )  # Exclude non-research items
     # Filter and format papers
     filtered_papers = {}
@@ -88,10 +120,16 @@ def zotero_search_tool(
             continue
         item_type = data.get("itemType")
-        if only_articles and (
+        logger.debug("Item type: %s", item_type)
+        # Exclude attachments, notes, and other unwanted types
+        if (
             not item_type
             or not isinstance(item_type, str)
-            or item_type not in filter_item_types
+            or item_type in filter_excluded_types  # Skip attachments & notes
+            or (
+                only_articles and item_type not in filter_item_types
+            )  # Skip non-research types
         ):
             continue
@@ -99,20 +137,27 @@ def zotero_search_tool(
         if not key:
             continue
+        # Use the imported utility function's mapping to get collection paths
+        collection_paths = item_to_collections.get(key, ["/Unknown"])
         filtered_papers[key] = {
             "Title": data.get("title", "N/A"),
             "Abstract": data.get("abstractNote", "N/A"),
             "Date": data.get("date", "N/A"),
             "URL": data.get("url", "N/A"),
             "Type": item_type if isinstance(item_type, str) else "N/A",
+            "Collections": collection_paths,  # Now displays full paths
         }
     if not filtered_papers:
-        logger.warning("No matching papers found for query: '%s'", query)
+        logger.error("No matching papers returned from Zotero for query: '%s'", query)
+        raise RuntimeError(
+            "No matching papers returned from Zotero. Please retry the same query."
+        )
     logger.info("Filtered %d items", len(filtered_papers))
-    # Prepare content with top 3 paper titles and types
+    # Prepare content with top 2 paper titles and types
     top_papers = list(filtered_papers.values())[:2]
     top_papers_info = "\n".join(
         [

aiagents4pharma 1.28.0__py3-none-any.whl → 1.29.0__py3-none-any.whl

aiagents4pharma 1.28.0py3-none-any.whl → 1.29.0py3-none-any.whl