PyPI - signalwire-agents - Versions diffs - 0.1.13__py3-none-any.whl → 1.0.17.dev4__py3-none-any.whl - Mend

signalwire-agents 0.1.13py3-none-any.whl → 1.0.17.dev4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (143) hide show

signalwire_agents/__init__.py +99 -15
signalwire_agents/agent_server.py +248 -60
signalwire_agents/agents/bedrock.py +296 -0
signalwire_agents/cli/__init__.py +9 -0
signalwire_agents/cli/build_search.py +951 -41
signalwire_agents/cli/config.py +80 -0
signalwire_agents/cli/core/__init__.py +10 -0
signalwire_agents/cli/core/agent_loader.py +470 -0
signalwire_agents/cli/core/argparse_helpers.py +179 -0
signalwire_agents/cli/core/dynamic_config.py +71 -0
signalwire_agents/cli/core/service_loader.py +303 -0
signalwire_agents/cli/dokku.py +2320 -0
signalwire_agents/cli/execution/__init__.py +10 -0
signalwire_agents/cli/execution/datamap_exec.py +446 -0
signalwire_agents/cli/execution/webhook_exec.py +134 -0
signalwire_agents/cli/init_project.py +2636 -0
signalwire_agents/cli/output/__init__.py +10 -0
signalwire_agents/cli/output/output_formatter.py +255 -0
signalwire_agents/cli/output/swml_dump.py +186 -0
signalwire_agents/cli/simulation/__init__.py +10 -0
signalwire_agents/cli/simulation/data_generation.py +374 -0
signalwire_agents/cli/simulation/data_overrides.py +200 -0
signalwire_agents/cli/simulation/mock_env.py +282 -0
signalwire_agents/cli/swaig_test_wrapper.py +52 -0
signalwire_agents/cli/test_swaig.py +566 -2366
signalwire_agents/cli/types.py +81 -0
signalwire_agents/core/__init__.py +2 -2
signalwire_agents/core/agent/__init__.py +12 -0
signalwire_agents/core/agent/config/__init__.py +12 -0
signalwire_agents/core/agent/deployment/__init__.py +9 -0
signalwire_agents/core/agent/deployment/handlers/__init__.py +9 -0
signalwire_agents/core/agent/prompt/__init__.py +14 -0
signalwire_agents/core/agent/prompt/manager.py +306 -0
signalwire_agents/core/agent/routing/__init__.py +9 -0
signalwire_agents/core/agent/security/__init__.py +9 -0
signalwire_agents/core/agent/swml/__init__.py +9 -0
signalwire_agents/core/agent/tools/__init__.py +15 -0
signalwire_agents/core/agent/tools/decorator.py +97 -0
signalwire_agents/core/agent/tools/registry.py +210 -0
signalwire_agents/core/agent_base.py +845 -2916
signalwire_agents/core/auth_handler.py +233 -0
signalwire_agents/core/config_loader.py +259 -0
signalwire_agents/core/contexts.py +418 -0
signalwire_agents/core/data_map.py +3 -15
signalwire_agents/core/function_result.py +116 -44
signalwire_agents/core/logging_config.py +162 -18
signalwire_agents/core/mixins/__init__.py +28 -0
signalwire_agents/core/mixins/ai_config_mixin.py +442 -0
signalwire_agents/core/mixins/auth_mixin.py +280 -0
signalwire_agents/core/mixins/prompt_mixin.py +358 -0
signalwire_agents/core/mixins/serverless_mixin.py +460 -0
signalwire_agents/core/mixins/skill_mixin.py +55 -0
signalwire_agents/core/mixins/state_mixin.py +153 -0
signalwire_agents/core/mixins/tool_mixin.py +230 -0
signalwire_agents/core/mixins/web_mixin.py +1142 -0
signalwire_agents/core/security_config.py +333 -0
signalwire_agents/core/skill_base.py +84 -1
signalwire_agents/core/skill_manager.py +62 -20
signalwire_agents/core/swaig_function.py +18 -5
signalwire_agents/core/swml_builder.py +207 -11
signalwire_agents/core/swml_handler.py +27 -21
signalwire_agents/core/swml_renderer.py +123 -312
signalwire_agents/core/swml_service.py +171 -203
signalwire_agents/mcp_gateway/__init__.py +29 -0
signalwire_agents/mcp_gateway/gateway_service.py +564 -0
signalwire_agents/mcp_gateway/mcp_manager.py +513 -0
signalwire_agents/mcp_gateway/session_manager.py +218 -0
signalwire_agents/prefabs/concierge.py +0 -3
signalwire_agents/prefabs/faq_bot.py +0 -3
signalwire_agents/prefabs/info_gatherer.py +0 -3
signalwire_agents/prefabs/receptionist.py +0 -3
signalwire_agents/prefabs/survey.py +0 -3
signalwire_agents/schema.json +9218 -5489
signalwire_agents/search/__init__.py +7 -1
signalwire_agents/search/document_processor.py +490 -31
signalwire_agents/search/index_builder.py +307 -37
signalwire_agents/search/migration.py +418 -0
signalwire_agents/search/models.py +30 -0
signalwire_agents/search/pgvector_backend.py +748 -0
signalwire_agents/search/query_processor.py +162 -31
signalwire_agents/search/search_engine.py +916 -35
signalwire_agents/search/search_service.py +376 -53
signalwire_agents/skills/README.md +452 -0
signalwire_agents/skills/__init__.py +14 -2
signalwire_agents/skills/api_ninjas_trivia/README.md +215 -0
signalwire_agents/skills/api_ninjas_trivia/__init__.py +12 -0
signalwire_agents/skills/api_ninjas_trivia/skill.py +237 -0
signalwire_agents/skills/datasphere/README.md +210 -0
signalwire_agents/skills/datasphere/skill.py +84 -3
signalwire_agents/skills/datasphere_serverless/README.md +258 -0
signalwire_agents/skills/datasphere_serverless/__init__.py +9 -0
signalwire_agents/skills/datasphere_serverless/skill.py +82 -1
signalwire_agents/skills/datetime/README.md +132 -0
signalwire_agents/skills/datetime/__init__.py +9 -0
signalwire_agents/skills/datetime/skill.py +20 -7
signalwire_agents/skills/joke/README.md +149 -0
signalwire_agents/skills/joke/__init__.py +9 -0
signalwire_agents/skills/joke/skill.py +21 -0
signalwire_agents/skills/math/README.md +161 -0
signalwire_agents/skills/math/__init__.py +9 -0
signalwire_agents/skills/math/skill.py +18 -4
signalwire_agents/skills/mcp_gateway/README.md +230 -0
signalwire_agents/skills/mcp_gateway/__init__.py +10 -0
signalwire_agents/skills/mcp_gateway/skill.py +421 -0
signalwire_agents/skills/native_vector_search/README.md +210 -0
signalwire_agents/skills/native_vector_search/__init__.py +9 -0
signalwire_agents/skills/native_vector_search/skill.py +569 -101
signalwire_agents/skills/play_background_file/README.md +218 -0
signalwire_agents/skills/play_background_file/__init__.py +12 -0
signalwire_agents/skills/play_background_file/skill.py +242 -0
signalwire_agents/skills/registry.py +395 -40
signalwire_agents/skills/spider/README.md +236 -0
signalwire_agents/skills/spider/__init__.py +13 -0
signalwire_agents/skills/spider/skill.py +598 -0
signalwire_agents/skills/swml_transfer/README.md +395 -0
signalwire_agents/skills/swml_transfer/__init__.py +10 -0
signalwire_agents/skills/swml_transfer/skill.py +359 -0
signalwire_agents/skills/weather_api/README.md +178 -0
signalwire_agents/skills/weather_api/__init__.py +12 -0
signalwire_agents/skills/weather_api/skill.py +191 -0
signalwire_agents/skills/web_search/README.md +163 -0
signalwire_agents/skills/web_search/__init__.py +9 -0
signalwire_agents/skills/web_search/skill.py +586 -112
signalwire_agents/skills/wikipedia_search/README.md +228 -0
signalwire_agents/{core/state → skills/wikipedia_search}/__init__.py +5 -4
signalwire_agents/skills/{wikipedia → wikipedia_search}/skill.py +33 -3
signalwire_agents/web/__init__.py +17 -0
signalwire_agents/web/web_service.py +559 -0
signalwire_agents-1.0.17.dev4.data/data/share/man/man1/sw-agent-init.1 +400 -0
signalwire_agents-1.0.17.dev4.data/data/share/man/man1/sw-search.1 +483 -0
signalwire_agents-1.0.17.dev4.data/data/share/man/man1/swaig-test.1 +308 -0
{signalwire_agents-0.1.13.dist-info → signalwire_agents-1.0.17.dev4.dist-info}/METADATA +347 -215
signalwire_agents-1.0.17.dev4.dist-info/RECORD +147 -0
signalwire_agents-1.0.17.dev4.dist-info/entry_points.txt +6 -0
signalwire_agents/core/state/file_state_manager.py +0 -219
signalwire_agents/core/state/state_manager.py +0 -101
signalwire_agents/skills/wikipedia/__init__.py +0 -9
signalwire_agents-0.1.13.data/data/schema.json +0 -5611
signalwire_agents-0.1.13.dist-info/RECORD +0 -67
signalwire_agents-0.1.13.dist-info/entry_points.txt +0 -3
{signalwire_agents-0.1.13.dist-info → signalwire_agents-1.0.17.dev4.dist-info}/WHEEL +0 -0
{signalwire_agents-0.1.13.dist-info → signalwire_agents-1.0.17.dev4.dist-info}/licenses/LICENSE +0 -0
{signalwire_agents-0.1.13.dist-info → signalwire_agents-1.0.17.dev4.dist-info}/top_level.txt +0 -0

signalwire_agents/search/query_processor.py CHANGED Viewed

@@ -77,22 +77,87 @@ def load_spacy_model(language: str):
             _spacy_warning_shown = True
         return None
-def vectorize_query(query: str):
+# Model cache - stores multiple models by name
+_model_cache = {}  # model_name -> SentenceTransformer instance
+_model_lock = None
+def set_global_model(model):
+    """Legacy function - adds model to cache instead of setting globally"""
+    if model and hasattr(model, 'model_name'):
+        _model_cache[model.model_name] = model
+        logger.info(f"Model added to cache: {model.model_name}")
+def _get_cached_model(model_name: str = None):
+    """Get or create cached sentence transformer model
+    Args:
+        model_name: Optional model name. If not provided, uses default.
+    """
+    global _model_cache, _model_lock
+    # Default model
+    if model_name is None:
+        model_name = 'sentence-transformers/all-mpnet-base-v2'
+    # Initialize lock if needed
+    if _model_lock is None:
+        import threading
+        _model_lock = threading.Lock()
+    # Check if model is already in cache
+    if model_name in _model_cache:
+        return _model_cache[model_name]
+    # Load model with lock to prevent race conditions
+    with _model_lock:
+        # Double check in case another thread loaded it
+        if model_name in _model_cache:
+            return _model_cache[model_name]
+        try:
+            from sentence_transformers import SentenceTransformer
+            logger.info(f"Loading sentence transformer model: {model_name}")
+            model = SentenceTransformer(model_name)
+            # Store the model name for identification
+            model.model_name = model_name
+            # Add to cache
+            _model_cache[model_name] = model
+            logger.info(f"Successfully loaded and cached model: {model_name}")
+            return model
+        except ImportError:
+            logger.error("sentence-transformers not available. Cannot load model.")
+            return None
+        except Exception as e:
+            logger.error(f"Failed to load model {model_name}: {e}")
+            return None
+def vectorize_query(query: str, model=None, model_name: str = None):
     """
     Vectorize query using sentence transformers
     Returns numpy array of embeddings
+    Args:
+        query: Query string to vectorize
+        model: Optional pre-loaded model instance. If not provided, uses cached model.
+        model_name: Optional model name to use if loading a new model
     """
     try:
-        from sentence_transformers import SentenceTransformer
         import numpy as np
-        # Use the same model as specified in the architecture
-        model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2')
+        # Use provided model or get cached one
+        if model is None:
+            model = _get_cached_model(model_name)
+            if model is None:
+                return None
         embedding = model.encode(query, show_progress_bar=False)
         return embedding
     except ImportError:
-        logger.error("sentence-transformers not available. Cannot vectorize query.")
+        logger.error("numpy not available. Cannot vectorize query.")
+        return None
+    except Exception as e:
+        logger.error(f"Error vectorizing query: {e}")
         return None
 # Language to NLTK stopwords mapping
@@ -118,15 +183,28 @@ stopwords_language_map = {
 # Function to ensure NLTK resources are downloaded
 def ensure_nltk_resources():
     """Download required NLTK resources if not already present"""
-    resources = ['punkt', 'wordnet', 'averaged_perceptron_tagger', 'stopwords']
+    resources = ['punkt', 'punkt_tab', 'wordnet', 'averaged_perceptron_tagger', 'stopwords']
     for resource in resources:
         try:
-            nltk.data.find(f'corpora/{resource}')
+            # Try different paths for different resource types
+            if resource in ['punkt', 'punkt_tab']:
+                nltk.data.find(f'tokenizers/{resource}')
+            elif resource in ['wordnet']:
+                nltk.data.find(f'corpora/{resource}')
+            elif resource in ['averaged_perceptron_tagger']:
+                nltk.data.find(f'taggers/{resource}')
+            elif resource in ['stopwords']:
+                nltk.data.find(f'corpora/{resource}')
+            else:
+                nltk.data.find(f'corpora/{resource}')
         except LookupError:
             try:
+                logger.info(f"Downloading NLTK resource '{resource}'...")
                 nltk.download(resource, quiet=True)
+                logger.info(f"Successfully downloaded NLTK resource '{resource}'")
             except Exception as e:
                 logger.warning(f"Failed to download NLTK resource '{resource}': {e}")
+                # Continue without this resource - some functionality may be degraded
 # Initialize NLTK resources
 ensure_nltk_resources()
@@ -186,7 +264,9 @@ def remove_duplicate_words(input_string: str) -> str:
 def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[List[str]] = None,
                     max_synonyms: int = 5, debug: bool = False, vector: bool = False,
-                    vectorize_query_param: bool = False, nlp_backend: str = 'nltk') -> Dict[str, Any]:
+                    vectorize_query_param: bool = False, nlp_backend: str = None,
+                    query_nlp_backend: str = 'nltk', model_name: str = None,
+                    preserve_original: bool = True) -> Dict[str, Any]:
     """
     Advanced query preprocessing with language detection, POS tagging, synonym expansion, and vectorization
@@ -198,12 +278,19 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
         debug: Enable debug output
         vector: Include vector embedding in output
         vectorize_query_param: If True, just vectorize without other processing
-        nlp_backend: NLP backend to use ('nltk' for fast, 'spacy' for better quality)
+        nlp_backend: DEPRECATED - use query_nlp_backend instead
+        query_nlp_backend: NLP backend for query processing ('nltk' for fast, 'spacy' for better quality)
     Returns:
         Dict containing processed query, language, POS tags, and optionally vector
     """
+    # Handle backward compatibility
+    if nlp_backend is not None:
+        query_nlp_backend = nlp_backend
+        if debug:
+            logger.info(f"Using deprecated 'nlp_backend' parameter, please use 'query_nlp_backend' instead")
     if vectorize_query_param:
         # Vectorize the query directly
         vectorized_query = vectorize_query(query)
@@ -226,18 +313,32 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
     # Load spaCy model based on the language and backend choice
     nlp = None
-    if nlp_backend == 'spacy':
+    if query_nlp_backend == 'spacy':
         nlp = load_spacy_model(language)
         if nlp is None and debug:
             logger.info("spaCy backend requested but not available, falling back to NLTK")
-    elif nlp_backend == 'nltk':
+    elif query_nlp_backend == 'nltk':
         if debug:
-            logger.info("Using NLTK backend for NLP processing")
+            logger.info("Using NLTK backend for query processing")
     else:
-        logger.warning(f"Unknown NLP backend '{nlp_backend}', using NLTK")
+        logger.warning(f"Unknown query NLP backend '{query_nlp_backend}', using NLTK")
+        query_nlp_backend = 'nltk'
     # Tokenization and stop word removal
-    tokens = nltk.word_tokenize(query)
+    try:
+        tokens = nltk.word_tokenize(query)
+    except LookupError as e:
+        # If tokenization fails, try to download punkt resources
+        logger.warning(f"NLTK tokenization failed: {e}")
+        try:
+            nltk.download('punkt', quiet=True)
+            nltk.download('punkt_tab', quiet=True)
+            tokens = nltk.word_tokenize(query)
+        except Exception as fallback_error:
+            # If all else fails, use simple split as fallback
+            logger.warning(f"NLTK tokenization fallback failed: {fallback_error}. Using simple word splitting.")
+            tokens = query.split()
     nltk_language = stopwords_language_map.get(language, 'english')
     try:
@@ -258,7 +359,7 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
     lemmas = []
     pos_tags = {}
-    if nlp and nlp_backend == 'spacy':
+    if nlp and query_nlp_backend == 'spacy':
         # Use spaCy for better POS tagging
         doc = nlp(" ".join(tokens))
         for token in doc:
@@ -270,27 +371,51 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
             logger.info(f"POS Tagging Results (spaCy): {pos_tags}")
     else:
         # Use NLTK (default or fallback)
-        nltk_pos_tags = nltk.pos_tag(tokens)
-        for token, pos_tag in nltk_pos_tags:
-            lemma = lemmatizer.lemmatize(token, get_wordnet_pos(pos_tag)).lower()
-            stemmed = stemmer.stem(lemma)
-            lemmas.append((token.lower(), stemmed))
-            pos_tags[token.lower()] = pos_tag
-        if debug:
-            logger.info(f"POS Tagging Results (NLTK): {pos_tags}")
+        try:
+            nltk_pos_tags = nltk.pos_tag(tokens)
+            for token, pos_tag in nltk_pos_tags:
+                try:
+                    lemma = lemmatizer.lemmatize(token, get_wordnet_pos(pos_tag)).lower()
+                except Exception:
+                    # Fallback if lemmatization fails
+                    lemma = token.lower()
+                stemmed = stemmer.stem(lemma)
+                lemmas.append((token.lower(), stemmed))
+                pos_tags[token.lower()] = pos_tag
+            if debug:
+                logger.info(f"POS Tagging Results (NLTK): {pos_tags}")
+        except Exception as pos_error:
+            # Fallback if POS tagging fails completely
+            logger.warning(f"NLTK POS tagging failed: {pos_error}. Using basic token processing.")
+            for token in tokens:
+                lemma = token.lower()
+                stemmed = stemmer.stem(lemma)
+                lemmas.append((token.lower(), stemmed))
+                pos_tags[token.lower()] = 'NN'  # Default to noun
+            if debug:
+                logger.info(f"Using fallback token processing for: {tokens}")
     # Expanding query with synonyms
     expanded_query_set = set()
     expanded_query = []
+    # If preserve_original is True, always include the original query first
+    if preserve_original:
+        # Add original query terms first (maintains exact phrases)
+        original_tokens = query.lower().split()
+        for token in original_tokens:
+            if token not in expanded_query_set:
+                expanded_query.append(token)
+                expanded_query_set.add(token)
     for original, lemma in lemmas:
         if original not in expanded_query_set:
             expanded_query.append(original)
             expanded_query_set.add(original)
-        if lemma not in expanded_query_set:
+        if lemma not in expanded_query_set and not preserve_original:  # Only add lemmas if not preserving original
             expanded_query.append(lemma)
             expanded_query_set.add(lemma)
-        if pos_tags.get(original) in pos_to_expand:
+        if pos_tags.get(original) in pos_to_expand and max_synonyms > 0:
             synonyms = get_synonyms(lemma, pos_tags[original], max_synonyms)
             for synonym in synonyms:
                 if synonym not in expanded_query_set:
@@ -303,19 +428,19 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
     if debug:
         logger.info(f"Expanded Query: {final_query_str}")
-        logger.info(f"NLP Backend Used: {nlp_backend if nlp or nlp_backend == 'nltk' else 'nltk (fallback)'}")
+        logger.info(f"NLP Backend Used: {query_nlp_backend if nlp or query_nlp_backend == 'nltk' else 'nltk (fallback)'}")
     formatted_output = {
         'input': final_query_str,
         'enhanced_text': final_query_str,  # Alias for compatibility
         'language': language,
         'POS': pos_tags,
-        'nlp_backend_used': nlp_backend if nlp or nlp_backend == 'nltk' else 'nltk'
+        'nlp_backend_used': query_nlp_backend if nlp or query_nlp_backend == 'nltk' else 'nltk'
     }
     # Vectorize query if requested
     if vector:
-        vectorized_query = vectorize_query(final_query_str)
+        vectorized_query = vectorize_query(final_query_str, model_name=model_name)
         if vectorized_query is not None:
             formatted_output['vector'] = vectorized_query.tolist()
         else:
@@ -323,19 +448,25 @@ def preprocess_query(query: str, language: str = 'en', pos_to_expand: Optional[L
     return formatted_output
-def preprocess_document_content(content: str, language: str = 'en', nlp_backend: str = 'nltk') -> Dict[str, Any]:
+def preprocess_document_content(content: str, language: str = 'en', nlp_backend: str = None,
+                               index_nlp_backend: str = 'nltk') -> Dict[str, Any]:
     """
     Preprocess document content for better searchability
     Args:
         content: Document content to process
         language: Language code for processing
-        nlp_backend: NLP backend to use ('nltk' for fast, 'spacy' for better quality)
+        nlp_backend: DEPRECATED - use index_nlp_backend instead
+        index_nlp_backend: NLP backend for document processing ('nltk' for fast, 'spacy' for better quality)
     Returns:
         Dict containing enhanced text and extracted keywords
     """
+    # Handle backward compatibility
+    if nlp_backend is not None:
+        index_nlp_backend = nlp_backend
     # Use existing preprocessing but adapted for documents
     processed = preprocess_query(
         content,
@@ -344,7 +475,7 @@ def preprocess_document_content(content: str, language: str = 'en', nlp_backend:
         max_synonyms=2,  # Fewer synonyms for documents
         debug=False,
         vector=False,
-        nlp_backend=nlp_backend
+        query_nlp_backend=index_nlp_backend
     )
     # Extract key terms for keyword search

signalwire-agents 0.1.13__py3-none-any.whl → 1.0.17.dev4__py3-none-any.whl

signalwire-agents 0.1.13py3-none-any.whl → 1.0.17.dev4py3-none-any.whl