PyPI - tooluniverse - Versions diffs - 1.0.10__py3-none-any.whl → 1.0.11__py3-none-any.whl - Mend

tooluniverse 1.0.10py3-none-any.whl → 1.0.11py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of tooluniverse might be problematic. Click here for more details.

Files changed (150) hide show

tooluniverse/__init__.py +57 -1
tooluniverse/blast_tool.py +132 -0
tooluniverse/boltz_tool.py +2 -2
tooluniverse/cbioportal_tool.py +42 -0
tooluniverse/clinvar_tool.py +268 -74
tooluniverse/compose_scripts/tool_discover.py +1941 -443
tooluniverse/data/agentic_tools.json +0 -370
tooluniverse/data/alphafold_tools.json +6 -6
tooluniverse/data/blast_tools.json +112 -0
tooluniverse/data/cbioportal_tools.json +87 -0
tooluniverse/data/clinvar_tools.json +235 -0
tooluniverse/data/compose_tools.json +0 -89
tooluniverse/data/dbsnp_tools.json +275 -0
tooluniverse/data/emdb_tools.json +61 -0
tooluniverse/data/ensembl_tools.json +259 -0
tooluniverse/data/file_download_tools.json +275 -0
tooluniverse/data/geo_tools.json +200 -48
tooluniverse/data/gnomad_tools.json +109 -0
tooluniverse/data/gtopdb_tools.json +68 -0
tooluniverse/data/gwas_tools.json +32 -0
tooluniverse/data/interpro_tools.json +199 -0
tooluniverse/data/jaspar_tools.json +70 -0
tooluniverse/data/kegg_tools.json +356 -0
tooluniverse/data/mpd_tools.json +87 -0
tooluniverse/data/ols_tools.json +314 -0
tooluniverse/data/package_discovery_tools.json +64 -0
tooluniverse/data/packages/categorized_tools.txt +0 -1
tooluniverse/data/packages/machine_learning_tools.json +0 -47
tooluniverse/data/paleobiology_tools.json +91 -0
tooluniverse/data/pride_tools.json +62 -0
tooluniverse/data/pypi_package_inspector_tools.json +158 -0
tooluniverse/data/python_executor_tools.json +341 -0
tooluniverse/data/regulomedb_tools.json +50 -0
tooluniverse/data/remap_tools.json +89 -0
tooluniverse/data/screen_tools.json +89 -0
tooluniverse/data/tool_discovery_agents.json +428 -0
tooluniverse/data/tool_discovery_agents.json.backup +1343 -0
tooluniverse/data/uniprot_tools.json +77 -0
tooluniverse/data/web_search_tools.json +250 -0
tooluniverse/data/worms_tools.json +55 -0
tooluniverse/dbsnp_tool.py +196 -58
tooluniverse/default_config.py +35 -2
tooluniverse/emdb_tool.py +30 -0
tooluniverse/ensembl_tool.py +140 -47
tooluniverse/execute_function.py +74 -14
tooluniverse/file_download_tool.py +269 -0
tooluniverse/geo_tool.py +81 -28
tooluniverse/gnomad_tool.py +100 -52
tooluniverse/gtopdb_tool.py +41 -0
tooluniverse/interpro_tool.py +72 -0
tooluniverse/jaspar_tool.py +30 -0
tooluniverse/kegg_tool.py +230 -0
tooluniverse/mpd_tool.py +42 -0
tooluniverse/ncbi_eutils_tool.py +96 -0
tooluniverse/ols_tool.py +435 -0
tooluniverse/package_discovery_tool.py +217 -0
tooluniverse/paleobiology_tool.py +30 -0
tooluniverse/pride_tool.py +30 -0
tooluniverse/pypi_package_inspector_tool.py +593 -0
tooluniverse/python_executor_tool.py +711 -0
tooluniverse/regulomedb_tool.py +30 -0
tooluniverse/remap_tool.py +44 -0
tooluniverse/remote/depmap_24q2/depmap_24q2_mcp_tool.py +1 -1
tooluniverse/screen_tool.py +44 -0
tooluniverse/smcp_server.py +3 -3
tooluniverse/tool_finder_embedding.py +3 -1
tooluniverse/tool_finder_keyword.py +3 -1
tooluniverse/tool_finder_llm.py +6 -2
tooluniverse/tools/{UCSC_get_genes_by_region.py → BLAST_nucleotide_search.py} +22 -26
tooluniverse/tools/BLAST_protein_search.py +63 -0
tooluniverse/tools/ClinVar_search_variants.py +26 -15
tooluniverse/tools/CodeQualityAnalyzer.py +3 -3
tooluniverse/tools/EMDB_get_structure.py +46 -0
tooluniverse/tools/GtoPdb_get_targets.py +52 -0
tooluniverse/tools/InterPro_get_domain_details.py +46 -0
tooluniverse/tools/InterPro_get_protein_domains.py +49 -0
tooluniverse/tools/InterPro_search_domains.py +52 -0
tooluniverse/tools/JASPAR_get_transcription_factors.py +52 -0
tooluniverse/tools/MPD_get_phenotype_data.py +59 -0
tooluniverse/tools/PRIDE_search_proteomics.py +52 -0
tooluniverse/tools/PackageAnalyzer.py +55 -0
tooluniverse/tools/Paleobiology_get_fossils.py +52 -0
tooluniverse/tools/PyPIPackageInspector.py +59 -0
tooluniverse/tools/ReMap_get_transcription_factor_binding.py +59 -0
tooluniverse/tools/ReferenceInfoAnalyzer.py +55 -0
tooluniverse/tools/RegulomeDB_query_variant.py +46 -0
tooluniverse/tools/SCREEN_get_regulatory_elements.py +59 -0
tooluniverse/tools/{ArgumentDescriptionOptimizer.py → TestResultsAnalyzer.py} +13 -13
tooluniverse/tools/ToolDiscover.py +11 -11
tooluniverse/tools/UniProt_id_mapping.py +63 -0
tooluniverse/tools/UniProt_search.py +63 -0
tooluniverse/tools/UnifiedToolGenerator.py +59 -0
tooluniverse/tools/WoRMS_search_species.py +49 -0
tooluniverse/tools/XMLToolOptimizer.py +55 -0
tooluniverse/tools/__init__.py +119 -29
tooluniverse/tools/alphafold_get_annotations.py +3 -3
tooluniverse/tools/alphafold_get_prediction.py +3 -3
tooluniverse/tools/alphafold_get_summary.py +3 -3
tooluniverse/tools/cBioPortal_get_cancer_studies.py +46 -0
tooluniverse/tools/cBioPortal_get_mutations.py +52 -0
tooluniverse/tools/{gnomAD_query_variant.py → clinvar_get_clinical_significance.py} +8 -11
tooluniverse/tools/clinvar_get_variant_details.py +49 -0
tooluniverse/tools/dbSNP_get_variant_by_rsid.py +7 -7
tooluniverse/tools/dbsnp_get_frequencies.py +46 -0
tooluniverse/tools/dbsnp_search_by_gene.py +52 -0
tooluniverse/tools/download_binary_file.py +66 -0
tooluniverse/tools/download_file.py +71 -0
tooluniverse/tools/download_text_content.py +55 -0
tooluniverse/tools/dynamic_package_discovery.py +59 -0
tooluniverse/tools/ensembl_get_sequence.py +52 -0
tooluniverse/tools/{Ensembl_lookup_gene_by_symbol.py → ensembl_get_variants.py} +11 -11
tooluniverse/tools/ensembl_lookup_gene.py +46 -0
tooluniverse/tools/geo_get_dataset_info.py +46 -0
tooluniverse/tools/geo_get_sample_info.py +46 -0
tooluniverse/tools/geo_search_datasets.py +67 -0
tooluniverse/tools/gnomad_get_gene_constraints.py +49 -0
tooluniverse/tools/kegg_find_genes.py +52 -0
tooluniverse/tools/kegg_get_gene_info.py +46 -0
tooluniverse/tools/kegg_get_pathway_info.py +46 -0
tooluniverse/tools/kegg_list_organisms.py +44 -0
tooluniverse/tools/kegg_search_pathway.py +46 -0
tooluniverse/tools/ols_find_similar_terms.py +63 -0
tooluniverse/tools/{get_hyperopt_info.py → ols_get_ontology_info.py} +13 -10
tooluniverse/tools/ols_get_term_ancestors.py +67 -0
tooluniverse/tools/ols_get_term_children.py +67 -0
tooluniverse/tools/{TestCaseGenerator.py → ols_get_term_info.py} +12 -9
tooluniverse/tools/{CodeOptimizer.py → ols_search_ontologies.py} +22 -14
tooluniverse/tools/ols_search_terms.py +71 -0
tooluniverse/tools/python_code_executor.py +79 -0
tooluniverse/tools/python_script_runner.py +79 -0
tooluniverse/tools/web_api_documentation_search.py +63 -0
tooluniverse/tools/web_search.py +71 -0
tooluniverse/uniprot_tool.py +219 -16
tooluniverse/url_tool.py +18 -0
tooluniverse/utils.py +2 -2
tooluniverse/web_search_tool.py +229 -0
tooluniverse/worms_tool.py +64 -0
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/METADATA +3 -2
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/RECORD +143 -54
tooluniverse/data/genomics_tools.json +0 -174
tooluniverse/tools/ToolDescriptionOptimizer.py +0 -67
tooluniverse/tools/ToolImplementationGenerator.py +0 -67
tooluniverse/tools/ToolOptimizer.py +0 -59
tooluniverse/tools/ToolSpecificationGenerator.py +0 -67
tooluniverse/tools/ToolSpecificationOptimizer.py +0 -63
tooluniverse/ucsc_tool.py +0 -60
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/WHEEL +0 -0
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/entry_points.txt +0 -0
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/licenses/LICENSE +0 -0
{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/top_level.txt +0 -0

tooluniverse/uniprot_tool.py CHANGED Viewed

@@ -1,3 +1,4 @@
+import time
 import requests
 from typing import Any, Dict
 from .base_tool import BaseTool
@@ -22,7 +23,7 @@ class UniProtRESTTool(BaseTool):
         """Custom data extraction with support for filtering"""
         # Handle specific UniProt extraction patterns
-        if extract_path == "comments[?(@.commentType=='FUNCTION')].texts[*].value":
+        if extract_path == ("comments[?(@.commentType==" "'FUNCTION')].texts[*].value"):
             # Extract function comments
             result = []
             for comment in data.get("comments", []):
@@ -32,41 +33,40 @@ class UniProtRESTTool(BaseTool):
                             result.append(text["value"])
             return result
-        elif (
-            extract_path
-            == "comments[?(@.commentType=='SUBCELLULAR LOCATION')].subcellularLocations[*].location.value"
+        elif extract_path == (
+            "comments[?(@.commentType=="
+            "'SUBCELLULAR LOCATION')].subcellularLocations[*].location.value"
         ):
             # Extract subcellular locations
             result = []
             for comment in data.get("comments", []):
                 if comment.get("commentType") == "SUBCELLULAR LOCATION":
                     for location in comment.get("subcellularLocations", []):
-                        if "location" in location and "value" in location["location"]:
+                        if "location" in location and ("value" in location["location"]):
                             result.append(location["location"]["value"])
             return result
         elif extract_path == "features[?(@.type=='VARIANT')]":
-            # Extract variant features (correct type is "Natural variant")
+            # Extract variant features
             result = []
             for feature in data.get("features", []):
                 if feature.get("type") == "Natural variant":
                     result.append(feature)
             return result
-        elif (
-            extract_path
-            == "features[?(@.type=='MODIFIED RESIDUE' || @.type=='SIGNAL')]"
+        elif extract_path == (
+            "features[?(@.type=='MODIFIED RESIDUE' || " "@.type=='SIGNAL')]"
         ):
-            # Extract PTM and signal features (correct types are "Modified residue" and "Signal")
+            # Extract PTM and signal features
             result = []
             for feature in data.get("features", []):
                 if feature.get("type") in ["Modified residue", "Signal"]:
                     result.append(feature)
             return result
-        elif (
-            extract_path
-            == "comments[?(@.commentType=='ALTERNATIVE PRODUCTS')].isoforms[*].isoformIds[*]"
+        elif extract_path == (
+            "comments[?(@.commentType=="
+            "'ALTERNATIVE PRODUCTS')].isoforms[*].isoformIds[*]"
         ):
             # Extract isoform IDs
             result = []
@@ -97,17 +97,220 @@ class UniProtRESTTool(BaseTool):
             return {"error": "jsonpath_ng library is required for data extraction"}
         except Exception as e:
             return {
-                "error": f"Failed to extract UniProt fields using JSONPath '{extract_path}': {e}"
+                "error": (
+                    f"Failed to extract UniProt fields using "
+                    f"JSONPath '{extract_path}': {e}"
+                )
             }
+    def _handle_search(self, arguments: Dict[str, Any]) -> Any:
+        """Handle search queries with flexible parameters"""
+        query = arguments.get("query", "")
+        organism = arguments.get("organism", "")
+        limit = min(arguments.get("limit", 25), 500)
+        fields = arguments.get("fields")
+        # Build query string
+        query_parts = [query]
+        if organism:
+            # Support common organism names
+            organism_map = {
+                "human": "9606",
+                "mouse": "10090",
+                "rat": "10116",
+                "yeast": "559292",
+            }
+            taxon_id = organism_map.get(organism.lower(), organism)
+            query_parts.append(f"organism_id:{taxon_id}")
+        full_query = " AND ".join(query_parts)
+        # Build parameters
+        params = {"query": full_query, "size": str(limit), "format": "json"}
+        # Add fields parameter if specified
+        if fields and isinstance(fields, list):
+            params["fields"] = ",".join(fields)
+        url = "https://rest.uniprot.org/uniprotkb/search"
+        try:
+            resp = requests.get(url, params=params, timeout=self.timeout)
+            resp.raise_for_status()
+            data = resp.json()
+            # Extract results
+            results = data.get("results", [])
+            formatted_results = []
+            for entry in results:
+                formatted_entry = {
+                    "accession": entry.get("primaryAccession", ""),
+                    "id": entry.get("uniProtkbId", ""),
+                    "protein_name": "",
+                    "gene_names": [],
+                    "organism": "",
+                    "length": 0,
+                }
+                # Extract protein name
+                protein_desc = entry.get("proteinDescription", {})
+                rec_name = protein_desc.get("recommendedName", {})
+                if rec_name:
+                    full_name = rec_name.get("fullName", {})
+                    if full_name:
+                        formatted_entry["protein_name"] = full_name.get("value", "")
+                # Extract gene names
+                genes = entry.get("genes", [])
+                for gene in genes:
+                    gene_name = gene.get("geneName", {})
+                    if gene_name:
+                        formatted_entry["gene_names"].append(gene_name.get("value", ""))
+                # Extract organism
+                organism_info = entry.get("organism", {})
+                formatted_entry["organism"] = organism_info.get("scientificName", "")
+                # Extract sequence length
+                sequence = entry.get("sequence", {})
+                formatted_entry["length"] = sequence.get("length", 0)
+                formatted_results.append(formatted_entry)
+            return {
+                "total_results": data.get("resultsFound", len(results)),
+                "returned": len(results),
+                "results": formatted_results,
+            }
+        except requests.exceptions.Timeout:
+            return {"error": "Request to UniProt API timed out"}
+        except requests.exceptions.RequestException as e:
+            return {"error": f"Request to UniProt API failed: {e}"}
+        except ValueError as e:
+            return {"error": f"Failed to parse JSON response: {e}"}
+    def _handle_id_mapping(self, arguments: Dict[str, Any]) -> Any:
+        """Handle ID mapping requests"""
+        ids = arguments.get("ids", [])
+        from_db = arguments.get("from_db", "")
+        to_db = arguments.get("to_db", "UniProtKB")
+        max_wait_time = arguments.get("max_wait_time", 30)
+        # Normalize IDs to list
+        if isinstance(ids, str):
+            ids = [ids]
+        # Normalize database names
+        db_mapping = {
+            "Ensembl": "Ensembl",
+            "Gene_Name": "Gene_Name",
+            "RefSeq_Protein": "RefSeq_Protein_ID",
+            "PDB": "PDB_ID",
+            "EMBL": "EMBL_ID",
+            "UniProtKB": "UniProtKB_AC-ID",
+        }
+        from_db_normalized = db_mapping.get(from_db, from_db)
+        to_db_normalized = db_mapping.get(to_db, to_db)
+        # Step 1: Submit mapping job
+        submit_url = "https://rest.uniprot.org/idmapping/run"
+        payload = {"ids": ids, "from": from_db_normalized, "to": to_db_normalized}
+        try:
+            resp = requests.post(submit_url, json=payload, timeout=self.timeout)
+            resp.raise_for_status()
+            job_data = resp.json()
+            job_id = job_data.get("jobId")
+            if not job_id:
+                return {"error": "Failed to get job ID from UniProt ID mapping"}
+            # Step 2: Poll for job completion
+            status_url = f"https://rest.uniprot.org/idmapping/status/{job_id}"
+            results_url = f"https://rest.uniprot.org/idmapping/results/{job_id}"
+            start_time = time.time()
+            while time.time() - start_time < max_wait_time:
+                status_resp = requests.get(status_url, timeout=self.timeout)
+                status_data = status_resp.json()
+                if status_data.get("status") == "FINISHED":
+                    # Step 3: Retrieve results
+                    results_resp = requests.get(results_url, timeout=self.timeout)
+                    results_data = results_resp.json()
+                    # Format results
+                    formatted_results = []
+                    failed = []
+                    # Extract mappings
+                    results = results_data.get("results", [])
+                    for result in results:
+                        from_value = result.get("from", "")
+                        to_values = result.get("to", {}).get("results", [])
+                        if to_values:
+                            for to_item in to_values:
+                                to_info = to_item.get("to", {})
+                                gene_names = to_info.get("geneNames", [])
+                                gene_name = ""
+                                if gene_names:
+                                    gene_name = gene_names[0].get("value", "")
+                                formatted_results.append(
+                                    {
+                                        "from": from_value,
+                                        "to": {
+                                            "accession": to_info.get(
+                                                "primaryAccession", ""
+                                            ),
+                                            "id": to_info.get("uniProtkbId", ""),
+                                            "gene_name": gene_name,
+                                        },
+                                    }
+                                )
+                        else:
+                            failed.append(from_value)
+                    return {
+                        "mapped_count": len(formatted_results),
+                        "results": formatted_results,
+                        "failed": list(set(failed)) if failed else [],
+                    }
+                elif status_data.get("status") == "FAILED":
+                    return {"error": "ID mapping job failed"}
+                time.sleep(1)  # Wait 1 second before next poll
+            return {"error": (f"ID mapping timed out after {max_wait_time} seconds")}
+        except requests.exceptions.Timeout:
+            return {"error": "Request to UniProt API timed out"}
+        except requests.exceptions.RequestException as e:
+            return {"error": f"Request to UniProt API failed: {e}"}
+        except ValueError as e:
+            return {"error": f"Failed to parse JSON response: {e}"}
     def run(self, arguments: Dict[str, Any]) -> Any:
-        # Build URL
+        # Check if this is a search request
+        search_type = self.tool_config.get("fields", {}).get("search_type")
+        mapping_type = self.tool_config.get("fields", {}).get("mapping_type")
+        if search_type == "search":
+            return self._handle_search(arguments)
+        elif mapping_type == "async":
+            return self._handle_id_mapping(arguments)
+        # Build URL for standard accession-based queries
         url = self._build_url(arguments)
         try:
             resp = requests.get(url, timeout=self.timeout)
             if resp.status_code != 200:
                 return {
-                    "error": f"UniProt API returned status code: {resp.status_code}",
+                    "error": (f"UniProt API returned status code: {resp.status_code}"),
                     "detail": resp.text,
                 }
             data = resp.json()

tooluniverse/url_tool.py CHANGED Viewed

@@ -188,6 +188,24 @@ class URLToPDFTextTool(BaseTool):
         timeout = arguments.get("timeout", 30)
+        # First, check if the URL returns HTML or a downloadable file
+        try:
+            resp = requests.head(url, timeout=timeout, allow_redirects=True)
+            content_type = resp.headers.get("Content-Type", "").lower()
+            # If it's not HTML, handle it as a simple text download
+            is_html = "text/html" in content_type or "application/xhtml" in content_type
+            if not is_html:
+                # Download the file directly and return its text content
+                resp = requests.get(url, timeout=timeout, allow_redirects=True)
+                if resp.status_code != 200:
+                    return {"error": f"HTTP {resp.status_code}"}
+                text = resp.text
+                if not text.strip():
+                    return {"error": "File appears to be empty or binary."}
+                return {self.return_key: text.strip()}
+        except requests.exceptions.RequestException as e:
+            return {"error": f"Failed to check content type: {e}"}
         # Ensure browsers are installed (auto-install if needed)
         ensure_error = self._ensure_playwright_browsers(
             browsers=("chromium",), with_deps=False

tooluniverse/utils.py CHANGED Viewed

@@ -117,7 +117,7 @@ def yaml_to_dict(yaml_file_path):
         dict: Dictionary representation of the YAML file content.
     """
     try:
-        with open(yaml_file_path, "r") as file:
+        with open(yaml_file_path, "r", encoding="utf-8") as file:
             yaml_dict = yaml.safe_load(file)
             return yaml_dict
     except FileNotFoundError:
@@ -136,7 +136,7 @@ def read_json_list(file_path):
     Returns
     list: A list of dictionaries containing the JSON objects.
     """
-    with open(file_path, "r") as file:
+    with open(file_path, "r", encoding="utf-8") as file:
         data = json.load(file)
     return data

tooluniverse/web_search_tool.py ADDED Viewed

@@ -0,0 +1,229 @@
+"""
+Web search tools for ToolUniverse using DDGS (Dux Distributed Global Search).
+This module provides web search capabilities using the ddgs library,
+which supports multiple search engines including DuckDuckGo, Google, Bing, etc.
+"""
+import time
+from typing import Dict, Any, List
+from ddgs import DDGS
+from .base_tool import BaseTool
+from .tool_registry import register_tool
+@register_tool("WebSearchTool")
+class WebSearchTool(BaseTool):
+    """
+    Web search tool using DDGS library.
+    This tool performs web searches using the DDGS library which supports
+    multiple search engines including Google, Bing, Brave, Yahoo, DuckDuckGo, etc.
+    """
+    def __init__(self, tool_config: Dict[str, Any]):
+        super().__init__(tool_config)
+        # DDGS instance will be created per request to avoid session issues
+    def _search_with_ddgs(
+        self,
+        query: str,
+        max_results: int = 10,
+        backend: str = "auto",
+        region: str = "us-en",
+        safesearch: str = "moderate",
+    ) -> List[Dict[str, Any]]:
+        """
+        Perform a web search using DDGS library and return formatted results.
+        Args:
+            query: Search query string
+            max_results: Maximum number of results to return
+            backend: Search engine backend (auto, google, bing, brave, etc.)
+            region: Search region (e.g., 'us-en', 'cn-zh')
+            safesearch: Safe search level ('on', 'moderate', 'off')
+        Returns:
+            List of search results with title, url, and snippet
+        """
+        try:
+            # Create DDGS instance
+            ddgs = DDGS()
+            # Perform search using DDGS
+            search_results = list(
+                ddgs.text(
+                    query=query,
+                    max_results=max_results,
+                    backend=backend,
+                    region=region,
+                    safesearch=safesearch,
+                )
+            )
+            # Convert DDGS results to our expected format
+            results = []
+            for i, result in enumerate(search_results):
+                results.append(
+                    {
+                        "title": result.get("title", ""),
+                        "url": result.get("href", ""),
+                        "snippet": result.get("body", ""),
+                        "rank": i + 1,
+                    }
+                )
+            return results
+        except Exception as e:
+            return [
+                {
+                    "title": "Search Error",
+                    "url": "",
+                    "snippet": f"Failed to perform search: {str(e)}",
+                    "rank": 0,
+                }
+            ]
+    def run(self, arguments: Dict[str, Any]) -> Dict[str, Any]:
+        """
+        Execute web search using DDGS.
+        Args:
+            arguments: Dictionary containing:
+                - query: Search query string
+                - max_results: Maximum number of results (default: 10)
+                - search_type: Type of search (default: 'general')
+                - backend: Search engine backend (default: 'auto')
+                - region: Search region (default: 'us-en')
+                - safesearch: Safe search level (default: 'moderate')
+        Returns:
+            Dictionary containing search results
+        """
+        try:
+            query = arguments.get("query", "").strip()
+            max_results = int(arguments.get("max_results", 10))
+            search_type = arguments.get("search_type", "general")
+            backend = arguments.get("backend", "auto")
+            region = arguments.get("region", "us-en")
+            safesearch = arguments.get("safesearch", "moderate")
+            if not query:
+                return {
+                    "status": "error",
+                    "error": "Query parameter is required",
+                    "results": [],
+                }
+            # Validate max_results
+            max_results = max(1, min(max_results, 50))  # Limit between 1-50
+            # Modify query based on search type
+            if search_type == "api_documentation":
+                query = f"{query} API documentation python library"
+            elif search_type == "python_packages":
+                query = f"{query} python package pypi"
+            elif search_type == "github":
+                query = f"{query} site:github.com"
+            # Perform search using DDGS
+            results = self._search_with_ddgs(
+                query=query,
+                max_results=max_results,
+                backend=backend,
+                region=region,
+                safesearch=safesearch,
+            )
+            # Add rate limiting to be respectful
+            time.sleep(0.5)
+            return {
+                "status": "success",
+                "query": query,
+                "search_type": search_type,
+                "total_results": len(results),
+                "results": results,
+            }
+        except Exception as e:
+            return {"status": "error", "error": str(e), "results": []}
+@register_tool("WebAPIDocumentationSearchTool")
+class WebAPIDocumentationSearchTool(WebSearchTool):
+    """
+    Specialized web search tool for API documentation and Python libraries.
+    This tool is optimized for finding API documentation, Python packages,
+    and technical resources using DDGS with multiple search engines.
+    """
+    def run(self, arguments: Dict[str, Any]) -> Dict[str, Any]:
+        """
+        Execute API documentation focused search.
+        Args:
+            arguments: Dictionary containing:
+                - query: Search query string
+                - max_results: Maximum number of results (default: 10)
+                - focus: Focus area ('api_docs', 'python_packages', etc.)
+                - backend: Search engine backend (default: 'auto')
+        Returns:
+            Dictionary containing search results
+        """
+        try:
+            query = arguments.get("query", "").strip()
+            focus = arguments.get("focus", "api_docs")
+            backend = arguments.get("backend", "auto")
+            if not query:
+                return {
+                    "status": "error",
+                    "error": "Query parameter is required",
+                    "results": [],
+                }
+            # Modify query based on focus
+            if focus == "api_docs":
+                enhanced_query = f'"{query}" API documentation official docs'
+            elif focus == "python_packages":
+                enhanced_query = f'"{query}" python package pypi install pip'
+            elif focus == "github_repos":
+                enhanced_query = f'"{query}" github repository source code'
+            else:
+                enhanced_query = f'"{query}" documentation API reference'
+            # Use parent class search with enhanced query
+            arguments["query"] = enhanced_query
+            arguments["search_type"] = "api_documentation"
+            arguments["backend"] = backend
+            result = super().run(arguments)
+            # Add focus-specific metadata
+            if result["status"] == "success":
+                result["focus"] = focus
+                result["enhanced_query"] = enhanced_query
+                # Filter results for better relevance
+                if focus == "python_packages":
+                    result["results"] = [
+                        r
+                        for r in result["results"]
+                        if (
+                            "pypi.org" in r.get("url", "")
+                            or "python" in r.get("title", "").lower()
+                        )
+                    ]
+                elif focus == "github_repos":
+                    result["results"] = [
+                        r for r in result["results"] if "github.com" in r.get("url", "")
+                    ]
+            return result
+        except Exception as e:
+            return {"status": "error", "error": str(e), "results": []}

tooluniverse/worms_tool.py ADDED Viewed

@@ -0,0 +1,64 @@
+import requests
+import urllib.parse
+from typing import Any, Dict
+from .base_tool import BaseTool
+from .tool_registry import register_tool
+@register_tool("WoRMSRESTTool")
+class WoRMSRESTTool(BaseTool):
+    def __init__(self, tool_config: Dict):
+        super().__init__(tool_config)
+        self.base_url = "https://www.marinespecies.org/rest"
+        self.session = requests.Session()
+        self.session.headers.update({"Accept": "application/json"})
+        self.timeout = 30
+    def _build_url(self, args: Dict[str, Any]) -> str:
+        url = self.tool_config["fields"]["endpoint"]
+        for k, v in args.items():
+            url = url.replace(f"{{{k}}}", str(v))
+        return url
+    def run(self, arguments: Dict[str, Any]) -> Dict[str, Any]:
+        try:
+            # Build URL with proper encoding
+            query = arguments.get("query", "")
+            if not query:
+                return {"status": "error", "error": "Query parameter is required"}
+            # URL encode the query
+            encoded_query = urllib.parse.quote(query)
+            url = (
+                f"https://www.marinespecies.org/rest/AphiaRecordsByName/{encoded_query}"
+            )
+            response = self.session.get(url, timeout=self.timeout)
+            response.raise_for_status()
+            # Check if response is empty
+            if not response.text.strip():
+                return {
+                    "status": "success",
+                    "data": [],
+                    "url": url,
+                    "message": "No results found for this query",
+                }
+            data = response.json()
+            # WoRMS returns array of species, extract first few results
+            if isinstance(data, list) and len(data) > 0:
+                # Limit results to first 5 for better performance
+                limited_data = data[:5]
+                return {
+                    "status": "success",
+                    "data": limited_data,
+                    "url": url,
+                    "count": len(limited_data),
+                    "total_found": len(data),
+                }
+            else:
+                return {"status": "success", "data": data, "url": url}
+        except Exception as e:
+            return {"status": "error", "error": f"WoRMS API error: {str(e)}"}

{tooluniverse-1.0.10.dist-info → tooluniverse-1.0.11.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: tooluniverse
-Version: 1.0.10
+Version: 1.0.11
 Summary: A comprehensive collection of scientific tools for Agentic AI, offering integration with the ToolUniverse SDK and MCP Server to support advanced scientific workflows.
 Author-email: Shanghua Gao <shanghuagao@gmail.com>
 Project-URL: Homepage, https://github.com/mims-harvard/ToolUniverse
@@ -29,7 +29,7 @@ Requires-Dist: sentence-transformers>=5.1.0
 Requires-Dist: fitz>=0.0.1.dev2
 Requires-Dist: pandas>=2.2.3
 Requires-Dist: admet-ai>=1.2.0
-Requires-Dist: setuptools>=70.0.0
+Requires-Dist: setuptools<81.0.0,>=70.0.0
 Requires-Dist: pdfplumber>=0.11.0
 Requires-Dist: playwright>=1.55.0
 Requires-Dist: faiss-cpu>=1.12.0
@@ -39,6 +39,7 @@ Requires-Dist: aiohttp
 Requires-Dist: beautifulsoup4>=4.12.0
 Requires-Dist: markitdown[all]>=0.1.0
 Requires-Dist: psutil>=5.9.0
+Requires-Dist: ddgs>=9.0.0
 Provides-Extra: dev
 Requires-Dist: pytest>=7.0; extra == "dev"
 Requires-Dist: pytest-cov>=4.0; extra == "dev"

tooluniverse 1.0.10__py3-none-any.whl → 1.0.11__py3-none-any.whl

Potentially problematic release.

tooluniverse 1.0.10py3-none-any.whl → 1.0.11py3-none-any.whl