PyPI - mem-llm - Versions diffs - 1.0.2__py3-none-any.whl → 2.1.0__py3-none-any.whl - Mend

mem-llm 1.0.2py3-none-any.whl → 2.1.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mem-llm might be problematic. Click here for more details.

Files changed (41) hide show

mem_llm/__init__.py +71 -8
mem_llm/api_server.py +595 -0
mem_llm/base_llm_client.py +201 -0
mem_llm/builtin_tools.py +311 -0
mem_llm/builtin_tools_async.py +170 -0
mem_llm/cli.py +254 -0
mem_llm/clients/__init__.py +22 -0
mem_llm/clients/lmstudio_client.py +393 -0
mem_llm/clients/ollama_client.py +354 -0
mem_llm/config.yaml.example +1 -1
mem_llm/config_from_docs.py +1 -1
mem_llm/config_manager.py +5 -3
mem_llm/conversation_summarizer.py +372 -0
mem_llm/data_export_import.py +640 -0
mem_llm/dynamic_prompt.py +298 -0
mem_llm/llm_client.py +77 -14
mem_llm/llm_client_factory.py +260 -0
mem_llm/logger.py +129 -0
mem_llm/mem_agent.py +1178 -87
mem_llm/memory_db.py +290 -59
mem_llm/memory_manager.py +60 -1
mem_llm/prompt_security.py +304 -0
mem_llm/response_metrics.py +221 -0
mem_llm/retry_handler.py +193 -0
mem_llm/thread_safe_db.py +301 -0
mem_llm/tool_system.py +537 -0
mem_llm/vector_store.py +278 -0
mem_llm/web_launcher.py +129 -0
mem_llm/web_ui/README.md +44 -0
mem_llm/web_ui/__init__.py +7 -0
mem_llm/web_ui/index.html +641 -0
mem_llm/web_ui/memory.html +569 -0
mem_llm/web_ui/metrics.html +75 -0
mem_llm-2.1.0.dist-info/METADATA +753 -0
mem_llm-2.1.0.dist-info/RECORD +40 -0
{mem_llm-1.0.2.dist-info → mem_llm-2.1.0.dist-info}/WHEEL +1 -1
mem_llm-2.1.0.dist-info/entry_points.txt +3 -0
mem_llm/prompt_templates.py +0 -244
mem_llm-1.0.2.dist-info/METADATA +0 -382
mem_llm-1.0.2.dist-info/RECORD +0 -15
{mem_llm-1.0.2.dist-info → mem_llm-2.1.0.dist-info}/top_level.txt +0 -0

mem_llm/mem_agent.py CHANGED Viewed

@@ -29,23 +29,28 @@ agent = MemAgent(
 ```
 """
-from typing import Optional, Dict, List, Any, Union
+from typing import Optional, Dict, List, Any, Union, Iterator
 from datetime import datetime
 import logging
 import json
 import os
+import time
 # Core dependencies
 from .memory_manager import MemoryManager
-from .llm_client import OllamaClient
+from .llm_client import OllamaClient  # Backward compatibility
+from .llm_client_factory import LLMClientFactory
+from .base_llm_client import BaseLLMClient
+from .response_metrics import ChatResponse, ResponseMetricsAnalyzer, calculate_confidence
+from .tool_system import ToolRegistry, ToolCallParser, format_tools_for_prompt
 # Advanced features (optional)
 try:
     from .memory_db import SQLMemoryManager
-    from .prompt_templates import prompt_manager
     from .knowledge_loader import KnowledgeLoader
     from .config_manager import get_config
     from .memory_tools import ToolExecutor, MemoryTools
+    from .dynamic_prompt import dynamic_prompt_builder
     ADVANCED_AVAILABLE = True
 except ImportError:
     ADVANCED_AVAILABLE = False
@@ -60,21 +65,69 @@ class MemAgent:
     """
     def __init__(self,
-                 model: str = "granite4:tiny-h",
+                 model: str = "granite4:3b",
+                 backend: str = "ollama",
                  config_file: Optional[str] = None,
                  use_sql: bool = True,
                  memory_dir: Optional[str] = None,
+                 db_path: Optional[str] = None,
                  load_knowledge_base: bool = True,
-                 ollama_url: str = "http://localhost:11434"):
+                 ollama_url: str = "http://localhost:11434",
+                 base_url: Optional[str] = None,
+                 api_key: Optional[str] = None,
+                 auto_detect_backend: bool = False,
+                 check_connection: bool = False,
+                enable_security: bool = False,
+                enable_vector_search: bool = False,
+                embedding_model: str = "all-MiniLM-L6-v2",
+               enable_tools: bool = False,
+               tools: Optional[List] = None,
+                **llm_kwargs):
         """
         Args:
             model: LLM model to use
+            backend: LLM backend ('ollama', 'lmstudio') - NEW in v1.3.0
             config_file: Configuration file (optional)
             use_sql: Use SQL database (True) or JSON (False)
-            memory_dir: Memory directory
+            memory_dir: Memory directory (for JSON mode or if db_path not specified)
+            db_path: SQLite database path (for SQL mode, e.g., ":memory:" or "path/to/db.db")
             load_knowledge_base: Automatically load knowledge base
-            ollama_url: Ollama API URL
+            ollama_url: Ollama API URL (backward compatibility, use base_url instead)
+            base_url: Backend API URL (for local backends) - NEW in v1.3.0
+            auto_detect_backend: Auto-detect available LLM backend - NEW in v1.3.0
+            check_connection: Verify LLM connection on startup (default: False)
+            enable_security: Enable prompt injection protection (v1.1.0+, default: False for backward compatibility)
+            enable_vector_search: Enable semantic/vector search for KB (v1.3.2+, requires chromadb) - NEW
+            embedding_model: Embedding model for vector search (default: "all-MiniLM-L6-v2") - NEW
+            **llm_kwargs: Additional backend-specific parameters
+        Examples:
+            # Default Ollama
+            agent = MemAgent()
+            # LM Studio
+            agent = MemAgent(backend='lmstudio', model='llama-3-8b')
+            # Auto-detect
+            agent = MemAgent(auto_detect_backend=True)
         """
+        # Setup logging first
+        self._setup_logging()
+        # Security features (v1.1.0+)
+        self.enable_security = enable_security
+        self.security_detector = None
+        self.security_sanitizer = None
+        if enable_security:
+            try:
+                from .prompt_security import PromptInjectionDetector, InputSanitizer
+                self.security_detector = PromptInjectionDetector()
+                self.security_sanitizer = InputSanitizer()
+                self.logger.info("🔒 Security features enabled (prompt injection protection)")
+            except ImportError:
+                self.logger.warning("⚠️  Security features requested but not available")
         # Load configuration
         self.config = None
@@ -95,39 +148,182 @@ class MemAgent:
             # No config file
             self.usage_mode = "personal"
-        # Setup logging
-        self._setup_logging()
-        # Memory system selection
+        # Initialize flags first
+        self.has_knowledge_base: bool = False  # Track KB status
+        self.has_tools: bool = False  # Track tools status (v1.3.x)
+        # Tool system (v2.0.0+)
+        self.enable_tools = enable_tools
+        self.tool_registry = None
+        if enable_tools:
+            self.tool_registry = ToolRegistry()
+            self.has_tools = True
+            # Register custom tools if provided
+            if tools:
+                for tool in tools:
+                    self.tool_registry.register_function(tool)
+                self.logger.info(f"🔧 Registered {len(tools)} custom tools")
+            builtin_count = len(self.tool_registry.tools)
+            self.logger.info(f"🛠️  Tool system enabled ({builtin_count} tools available)")
+        # Memory system
         if use_sql and ADVANCED_AVAILABLE:
             # SQL memory (advanced)
-            db_path = memory_dir or self.config.get("memory.db_path", "memories.db") if self.config else "memories.db"
-            self.memory = SQLMemoryManager(db_path)
-            self.logger.info(f"SQL memory system active: {db_path}")
+            # Determine database path
+            if db_path:
+                # Use provided db_path (can be ":memory:" for in-memory DB)
+                final_db_path = db_path
+            elif memory_dir:
+                final_db_path = memory_dir
+            elif self.config:
+                final_db_path = self.config.get("memory.db_path", "memories/memories.db")
+            else:
+                final_db_path = "memories/memories.db"
+            # Get vector search settings from config or parameters
+            vector_search_enabled = enable_vector_search
+            vector_model = embedding_model
+            if self.config:
+                vector_search_enabled = self.config.get("knowledge_base.enable_vector_search", vector_search_enabled)
+                vector_model = self.config.get("knowledge_base.embedding_model", vector_model)
+            # Ensure memories directory exists (skip for :memory:)
+            import os
+            if final_db_path != ":memory:":
+                db_dir = os.path.dirname(final_db_path)
+                if db_dir and not os.path.exists(db_dir):
+                    os.makedirs(db_dir, exist_ok=True)
+            self.memory = SQLMemoryManager(
+                final_db_path,
+                enable_vector_search=vector_search_enabled,
+                embedding_model=vector_model
+            )
+            self.logger.info(f"SQL memory system active: {final_db_path}")
+            if vector_search_enabled:
+                self.logger.info(f"🔍 Vector search enabled (model: {vector_model})")
         else:
             # JSON memory (simple)
             json_dir = memory_dir or self.config.get("memory.json_dir", "memories") if self.config else "memories"
             self.memory = MemoryManager(json_dir)
             self.logger.info(f"JSON memory system active: {json_dir}")
+        # Active user and system prompt
+        self.current_user: Optional[str] = None
+        self.current_system_prompt: Optional[str] = None
         # LLM client
         self.model = model  # Store model name
+        self.backend = backend  # Store backend name
         self.use_sql = use_sql  # Store SQL usage flag
-        self.llm = OllamaClient(model, ollama_url)
-        self.logger.info(f"LLM client ready: {model}")
+        # Initialize LLM client (v1.3.0: Multi-backend support)
+        # Prepare backend configuration
+        llm_config = llm_kwargs.copy()
+        # Handle backward compatibility: ollama_url -> base_url
+        if base_url is None and backend == "ollama":
+            base_url = ollama_url
+        # Add base_url for local backends
+        if base_url and backend in ['ollama', 'lmstudio']:
+            llm_config['base_url'] = base_url
+        # Add api_key for cloud backends
+        # Auto-detect backend if requested
+        if auto_detect_backend:
+            self.logger.info("🔍 Auto-detecting available LLM backend...")
+            self.llm = LLMClientFactory.auto_detect()
+            if self.llm:
+                detected_backend = self.llm.__class__.__name__
+                self.logger.info(f"✅ Detected and using: {detected_backend}")
+            else:
+                self.logger.error("❌ No LLM backend available.")
+                raise RuntimeError(
+                    "No LLM backend detected. Please start a local LLM service (Ollama or LM Studio)."
+                )
+        else:
+            # Create client using factory
+            try:
+                self.llm = LLMClientFactory.create(
+                    backend=backend,
+                    model=model,
+                    **llm_config
+                )
+                self.logger.info(f"✅ Initialized {backend} backend with model: {model}")
+            except Exception as e:
+                self.logger.error(f"❌ Failed to initialize {backend} backend: {e}")
+                raise
+        # Optional connection check on startup
+        if check_connection:
+            backend_name = backend if not auto_detect_backend else "LLM service"
+            self.logger.info(f"Checking {backend_name} connection...")
+            if not self.llm.check_connection():
+                error_msg = f"❌ ERROR: Cannot connect to {backend_name}!\n"
+                if backend == "ollama":
+                    error_msg += (
+                        "   \n"
+                        "   Solutions:\n"
+                        "   1. Start Ollama: ollama serve\n"
+                        "   2. Check if Ollama is running: http://localhost:11434\n"
+                        "   3. Verify base_url parameter is correct\n"
+                    )
+                elif backend == "lmstudio":
+                    error_msg += (
+                        "   \n"
+                        "   Solutions:\n"
+                        "   1. Start LM Studio\n"
+                        "   2. Load a model in LM Studio\n"
+                        "   3. Start local server (default: http://localhost:1234)\n"
+                        "   4. Verify base_url parameter is correct\n"
+                    )
+                error_msg += "   \n   To skip this check, use: MemAgent(check_connection=False)"
+                self.logger.error(error_msg)
+                raise ConnectionError(f"{backend_name} not available")
+            # Check if model exists (for backends that support listing)
+            try:
+                available_models = self.llm.list_models()
+                if available_models and model not in available_models:
+                    error_msg = (
+                        f"❌ ERROR: Model '{model}' not found in {backend}!\n"
+                        f"   \n"
+                        f"   Available models: {', '.join(available_models[:5])}\n"
+                        f"   Total: {len(available_models)} models available\n"
+                        f"   \n"
+                        f"   To skip this check, use: MemAgent(check_connection=False)"
+                    )
+                    self.logger.error(error_msg)
+                    raise ValueError(f"Model '{model}' not available")
+            except:
+                # Some backends may not support list_models, skip check
+                pass
+            self.logger.info(f"✅ {backend_name} connection verified, model '{model}' ready")
+        self.logger.info(f"LLM client ready: {model} on {backend}")
         # Advanced features (if available)
         if ADVANCED_AVAILABLE:
             self._setup_advanced_features(load_knowledge_base)
         else:
             print("⚠️  Load additional packages for advanced features")
-        # Active user and system prompt
-        self.current_user: Optional[str] = None
-        self.current_system_prompt: Optional[str] = None
+            # Build basic prompt even without advanced features
+            self._build_dynamic_system_prompt()
         # Tool system (always available)
         self.tool_executor = ToolExecutor(self.memory)
+        # Metrics tracking system (v1.3.1+)
+        self.metrics_analyzer = ResponseMetricsAnalyzer()
+        self.track_metrics = True  # Can be disabled if needed
         self.logger.info("MemAgent successfully initialized")
@@ -139,17 +335,23 @@ class MemAgent:
         if ADVANCED_AVAILABLE and hasattr(self, 'config') and self.config:
             log_config = self.config.get("logging", {})
+        # Default to WARNING level to keep console clean (users can override in config)
+        default_level = "WARNING"
         if log_config.get("enabled", True):
+            # Only console logging (no file) - keep workspace clean
             logging.basicConfig(
-                level=getattr(logging, log_config.get("level", "INFO")),
+                level=getattr(logging, log_config.get("level", default_level)),
                 format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
                 handlers=[
-                    logging.FileHandler(log_config.get("file", "mem_agent.log")),
-                    logging.StreamHandler()
+                    logging.StreamHandler()  # Console only
                 ]
             )
         self.logger = logging.getLogger("MemAgent")
+        # Set default level for mem_llm loggers
+        logging.getLogger("mem_llm").setLevel(getattr(logging, log_config.get("level", default_level)))
     def _setup_advanced_features(self, load_knowledge_base: bool) -> None:
         """Setup advanced features"""
@@ -171,60 +373,79 @@ class MemAgent:
                     if default_kb == "ecommerce":
                         count = kb_loader.load_default_ecommerce_kb()
                         self.logger.info(f"E-commerce knowledge base loaded: {count} records")
+                        self.has_knowledge_base = True  # KB loaded!
                     elif default_kb == "tech_support":
                         count = kb_loader.load_default_tech_support_kb()
                         self.logger.info(f"Technical support knowledge base loaded: {count} records")
+                        self.has_knowledge_base = True  # KB loaded!
                     elif default_kb == "business_tech_support":
                         count = kb_loader.load_default_tech_support_kb()
                         self.logger.info(f"Corporate technical support knowledge base loaded: {count} records")
+                        self.has_knowledge_base = True  # KB loaded!
                     elif default_kb == "personal_learning":
                         # Simple KB for personal learning
                         count = kb_loader.load_default_ecommerce_kb()  # Temporarily use the same KB
                         self.logger.info(f"Personal learning knowledge base loaded: {count} records")
+                        self.has_knowledge_base = True  # KB loaded!
                 except Exception as e:
                     self.logger.error(f"Knowledge base loading error: {e}")
-        # Load system prompt (according to usage mode)
+                    self.has_knowledge_base = False
+        # Build dynamic system prompt based on active features
+        self._build_dynamic_system_prompt()
+    def _build_dynamic_system_prompt(self) -> None:
+        """Build dynamic system prompt based on active features"""
+        if not ADVANCED_AVAILABLE:
+            # Fallback simple prompt
+            self.current_system_prompt = "You are a helpful AI assistant."
+            return
+        # Get config data
+        business_config = None
+        personal_config = None
         if hasattr(self, 'config') and self.config:
-            prompt_config = self.config.get("prompt", {})
-            # Select default template according to usage mode
-            if self.usage_mode == "business":
-                default_template = "business_customer_service"
-            else:  # personal
-                default_template = "personal_assistant"
-            template_name = prompt_config.get("template", default_template)
-            variables = prompt_config.get("variables", {})
-            # Additional variables for business mode
             if self.usage_mode == "business":
                 business_config = self.config.get("business", {})
-                variables.update({
-                    "company_name": business_config.get("company_name", "Our Company"),
-                    "founded_year": business_config.get("founded_year", "2010"),
-                    "employee_count": business_config.get("employee_count", "100+"),
-                    "industry": business_config.get("industry", "Teknoloji")
-                })
-            else:  # personal
+            else:
                 personal_config = self.config.get("personal", {})
-                variables.update({
-                    "user_name": personal_config.get("user_name", "User"),
-                    "timezone": personal_config.get("timezone", "Europe/London")
-                })
-            try:
-                variables['current_date'] = datetime.now().strftime("%Y-%m-%d")
-                self.current_system_prompt = prompt_manager.render_prompt(template_name, **variables)
-                self.logger.info(f"Prompt template loaded: {template_name} (Mode: {self.usage_mode})")
-            except Exception as e:
-                self.logger.error(f"Prompt template loading error: {e}")
-                # Simple, short and effective default prompt
-                self.current_system_prompt = """You are a helpful AI assistant. Be concise and direct.
-- Give short, clear answers (2-3 sentences max)
-- Only use information from conversation history
-- If you don't know something, say so
-- Don't make assumptions or hallucinate"""
+        # Check if tools are enabled (future feature)
+        # For now, tools are always available but not advertised in prompt
+        # self.has_tools = False  # Will be enabled when tool system is ready
+        # Build prompt using dynamic builder
+        try:
+            self.current_system_prompt = dynamic_prompt_builder.build_prompt(
+                usage_mode=self.usage_mode,
+                has_knowledge_base=self.has_knowledge_base,
+                has_tools=self.enable_tools,  # Now advertised when enabled (v2.0+)
+                is_multi_user=False,  # Always False for now, per-session state
+                business_config=business_config,
+                personal_config=personal_config,
+                memory_type="sql" if self.use_sql else "json"
+            )
+            # Add tool information to prompt if tools are enabled (v2.0+)
+            if self.enable_tools and self.tool_registry:
+                tools_list = self.tool_registry.list_tools()
+                tools_prompt = format_tools_for_prompt(tools_list)
+                self.current_system_prompt += f"\n\n{tools_prompt}"
+            # Log feature summary
+            feature_summary = dynamic_prompt_builder.get_feature_summary(
+                has_knowledge_base=self.has_knowledge_base,
+                has_tools=self.enable_tools,
+                is_multi_user=False,
+                memory_type="sql" if self.use_sql else "json"
+            )
+            self.logger.info(f"Dynamic prompt built: {feature_summary}")
+        except Exception as e:
+            self.logger.error(f"Dynamic prompt building error: {e}")
+            # Fallback
+            self.current_system_prompt = "You are a helpful AI assistant."
     def check_setup(self) -> Dict[str, Any]:
         """Check system setup"""
@@ -282,9 +503,130 @@ class MemAgent:
                 self.memory.update_user_profile(user_id, {"name": name})
         self.logger.debug(f"Active user set: {user_id}")
+    def _execute_tool_calls(self, response_text: str, max_iterations: int = 3) -> str:
+        """
+        Execute tool calls found in LLM response and get results.
+        Args:
+            response_text: LLM response that may contain tool calls
+            max_iterations: Maximum number of tool execution iterations
+        Returns:
+            Final response after all tool executions
+        """
+        iteration = 0
+        current_text = response_text
+        while iteration < max_iterations:
+            # Check if response contains tool calls
+            if not ToolCallParser.has_tool_call(current_text):
+                break
+            # Parse tool calls
+            tool_calls = ToolCallParser.parse(current_text)
+            if not tool_calls:
+                break
+            self.logger.info(f"🔧 Detected {len(tool_calls)} tool call(s)")
+            # Execute each tool
+            tool_results = []
+            for call in tool_calls:
+                tool_name = call["tool"]
+                arguments = call["arguments"]
+                self.logger.info(f"  Executing: {tool_name}({arguments})")
+                # Execute tool
+                result = self.tool_registry.execute(tool_name, **arguments)
+                # Handle memory-specific tools
+                if result.status.value == "success" and isinstance(result.result, str):
+                    if result.result.startswith("MEMORY_SEARCH:"):
+                        keyword = result.result.split(":", 1)[1]
+                        try:
+                            search_results = self.memory_manager.search_conversations(keyword)
+                            if search_results:
+                                formatted = f"Found {len(search_results)} results for '{keyword}':\n"
+                                for idx, conv in enumerate(search_results[:5], 1):
+                                    formatted += f"{idx}. {conv.get('user', 'N/A')}: {conv.get('message', 'N/A')[:100]}...\n"
+                                result.result = formatted
+                            else:
+                                result.result = f"No conversations found containing '{keyword}'"
+                        except Exception as e:
+                            result.result = f"Memory search error: {e}"
+                    elif result.result == "MEMORY_USER_INFO":
+                        try:
+                            user_info = f"Current user: {self.current_user or 'Not set'}"
+                            if self.current_user:
+                                conv_count = len(self.memory_manager.get_conversation_history(self.current_user))
+                                user_info += f"\nTotal conversations: {conv_count}"
+                            result.result = user_info
+                        except Exception as e:
+                            result.result = f"User info error: {e}"
+                    elif result.result.startswith("MEMORY_LIST_CONVERSATIONS:"):
+                        try:
+                            limit = int(result.result.split(":", 1)[1])
+                            history = self.memory_manager.get_conversation_history(self.current_user or "default", limit=limit)
+                            if history:
+                                formatted = f"Last {len(history)} conversations:\n"
+                                for idx, conv in enumerate(history, 1):
+                                    role = conv.get('role', 'unknown')
+                                    msg = conv.get('content', '')[:80]
+                                    formatted += f"{idx}. [{role}] {msg}...\n"
+                                result.result = formatted
+                            else:
+                                result.result = "No conversation history found"
+                        except Exception as e:
+                            result.result = f"Conversation list error: {e}"
+                if result.status.value == "success":  # Compare with enum value
+                    self.logger.info(f"  ✅ Success: {result.result}")
+                    tool_results.append(f"Tool '{tool_name}' returned: {result.result}")
+                else:
+                    self.logger.warning(f"  ❌ Error: {result.error}")
+                    tool_results.append(f"Tool '{tool_name}' failed with error: {result.error}")
+            # Remove tool call syntax from response
+            clean_text = ToolCallParser.remove_tool_calls(current_text)
+            # If we have tool results, ask LLM to continue with the results
+            if tool_results:
+                results_text = "\n".join(tool_results)
+                # Build follow-up message for LLM
+                follow_up = f"{clean_text}\n\nTool Results:\n{results_text}\n\nPlease provide the final answer to the user based on these results."
+                # Get LLM response with tool results
+                try:
+                    messages = [
+                        {"role": "system", "content": "You are a helpful assistant. Use the tool results to answer the user's question."},
+                        {"role": "user", "content": follow_up}
+                    ]
+                    llm_response = self.llm.chat(
+                        messages=messages,
+                        temperature=0.7,
+                        max_tokens=500
+                    )
+                    current_text = llm_response
+                    iteration += 1
+                except Exception as e:
+                    self.logger.error(f"Error getting follow-up response: {e}")
+                    # Return what we have
+                    return f"{clean_text}\n\n{results_text}"
+            else:
+                # No tool results, return clean text
+                return clean_text
+        return current_text
     def chat(self, message: str, user_id: Optional[str] = None,
-             metadata: Optional[Dict] = None) -> str:
+             metadata: Optional[Dict] = None, return_metrics: bool = False) -> Union[str, ChatResponse]:
         """
         Chat with user
@@ -292,37 +634,103 @@ class MemAgent:
             message: User's message
             user_id: User ID (optional)
             metadata: Additional information
+            return_metrics: If True, returns ChatResponse with metrics; if False, returns only text (default)
         Returns:
-            Bot's response
+            Bot's response (str) or ChatResponse object with metrics
         """
+        # Start timing
+        start_time = time.time()
         # Determine user
         if user_id:
             self.set_user(user_id)
         elif not self.current_user:
-            return "Error: User ID not specified."
+            error_response = "Error: User ID not specified."
+            if return_metrics:
+                return ChatResponse(
+                    text=error_response,
+                    confidence=1.0,
+                    source="tool",
+                    latency=(time.time() - start_time) * 1000,
+                    timestamp=datetime.now(),
+                    kb_results_count=0,
+                    metadata={"error": True}
+                )
+            return error_response
         user_id = self.current_user
+        # Initialize tracking variables
+        kb_results_count = 0
+        used_kb = False
+        used_memory = False
+        response_source = "model"  # Default source
+        # Security check (v1.1.0+) - opt-in
+        security_info = {}
+        if self.enable_security and self.security_detector and self.security_sanitizer:
+            # Detect injection attempts
+            risk_level = self.security_detector.get_risk_level(message)
+            is_suspicious, patterns = self.security_detector.detect(message)
+            if risk_level in ["high", "critical"]:
+                self.logger.warning(f"🚨 Blocked {risk_level} risk input from {user_id}: {len(patterns)} patterns detected")
+                return f"⚠️ Your message was blocked due to security concerns. Please rephrase your request."
+            if is_suspicious:
+                self.logger.info(f"⚠️ Suspicious input from {user_id} (risk: {risk_level}): {len(patterns)} patterns")
+            # Sanitize input
+            original_message = message
+            message = self.security_sanitizer.sanitize(message, aggressive=(risk_level == "medium"))
+            if message != original_message:
+                self.logger.debug(f"Input sanitized for {user_id}")
+            security_info = {
+                "risk_level": risk_level,
+                "sanitized": message != original_message,
+                "patterns_detected": len(patterns)
+            }
         # Check tool commands first
         tool_result = self.tool_executor.execute_user_command(message, user_id)
         if tool_result:
+            latency = (time.time() - start_time) * 1000
+            if return_metrics:
+                return ChatResponse(
+                    text=tool_result,
+                    confidence=0.95,  # Tools are deterministic
+                    source="tool",
+                    latency=latency,
+                    timestamp=datetime.now(),
+                    kb_results_count=0,
+                    metadata={"tool_command": True}
+                )
             return tool_result
         # Knowledge base search (if using SQL)
         kb_context = ""
-        if ADVANCED_AVAILABLE and isinstance(self.memory, SQLMemoryManager) and hasattr(self, 'config') and self.config:
-            if self.config.get("response.use_knowledge_base", True):
+        if ADVANCED_AVAILABLE and isinstance(self.memory, SQLMemoryManager):
+            # Check config only if it exists, otherwise always use KB
+            use_kb = True
+            kb_limit = 5
+            if hasattr(self, 'config') and self.config:
+                use_kb = self.config.get("response.use_knowledge_base", True)
+                kb_limit = self.config.get("knowledge_base.search_limit", 5)
+            if use_kb:
                 try:
-                    kb_results = self.memory.search_knowledge(
-                        query=message,
-                        limit=self.config.get("knowledge_base.search_limit", 5)
-                    )
+                    kb_results = self.memory.search_knowledge(query=message, limit=kb_limit)
                     if kb_results:
-                        kb_context = "\n\nRelevant Information:\n"
+                        kb_results_count = len(kb_results)
+                        used_kb = True
+                        kb_context = "\n\n📚 RELEVANT KNOWLEDGE BASE:\n"
                         for i, result in enumerate(kb_results, 1):
-                            kb_context += f"{i}. S: {result['question']}\n   C: {result['answer']}\n"
+                            kb_context += f"{i}. Q: {result['question']}\n   A: {result['answer']}\n"
+                        kb_context += "\n⚠️ USE THIS INFORMATION TO ANSWER! Be brief but accurate.\n"
                 except Exception as e:
                     self.logger.error(f"Knowledge base search error: {e}")
@@ -337,6 +745,9 @@ class MemAgent:
                 recent_limit = self.config.get("response.recent_conversations_limit", 5) if hasattr(self, 'config') and self.config else 5
                 recent_convs = self.memory.get_recent_conversations(user_id, recent_limit)
+                if recent_convs:
+                    used_memory = True
                 # Add conversations in chronological order (oldest first)
                 for conv in recent_convs:
                     messages.append({"role": "user", "content": conv.get('user_message', '')})
@@ -344,27 +755,86 @@ class MemAgent:
         except Exception as e:
             self.logger.error(f"Memory history loading error: {e}")
-        # Add knowledge base context
+        # Add current message WITH knowledge base context (if available)
+        final_message = message
         if kb_context:
-            messages.append({
-                "role": "system",
-                "content": f"You can use this information when answering the user's question:{kb_context}"
-            })
-        # Add current message
-        messages.append({"role": "user", "content": message})
+            # Inject KB directly into user message for maximum visibility
+            final_message = f"{kb_context}\n\nUser Question: {message}"
+        messages.append({"role": "user", "content": final_message})
         # Get response from LLM
+        temperature = self.config.get("llm.temperature", 0.2) if hasattr(self, 'config') and self.config else 0.2
         try:
             response = self.llm.chat(
                 messages=messages,
-                temperature=self.config.get("llm.temperature", 0.3) if hasattr(self, 'config') and self.config else 0.3,  # Lower = more focused
-                max_tokens=self.config.get("llm.max_tokens", 300) if hasattr(self, 'config') and self.config else 300  # Shorter responses
+                temperature=temperature,
+                max_tokens=self.config.get("llm.max_tokens", 2000) if hasattr(self, 'config') and self.config else 2000  # Enough tokens for thinking models
             )
+            # Fallback: If response is empty (can happen with thinking models)
+            if not response or response.strip() == "":
+                self.logger.warning(f"Empty response from model {self.llm.model}, retrying with simpler prompt...")
+                # Retry with just the current message, no history
+                simple_messages = [
+                    {"role": "system", "content": "You are a helpful assistant. Respond directly and concisely."},
+                    {"role": "user", "content": message}
+                ]
+                response = self.llm.chat(simple_messages, temperature=0.7, max_tokens=2000)
+                # If still empty, provide fallback
+                if not response or response.strip() == "":
+                    response = "I'm having trouble responding right now. Could you rephrase your question?"
+                    self.logger.error(f"Model {self.llm.model} returned empty response even after retry")
         except Exception as e:
             self.logger.error(f"LLM response error: {e}")
             response = "Sorry, I cannot respond right now. Please try again later."
+        # Execute tool calls if tools are enabled (v2.0+)
+        if self.enable_tools and self.tool_registry and response:
+            try:
+                response = self._execute_tool_calls(response)
+            except Exception as e:
+                self.logger.error(f"Tool execution error: {e}")
+                # Continue with original response
+        # Calculate latency
+        latency = (time.time() - start_time) * 1000
+        # Determine response source
+        if used_kb and used_memory:
+            response_source = "hybrid"
+        elif used_kb:
+            response_source = "knowledge_base"
+        else:
+            response_source = "model"
+        # Calculate confidence score
+        confidence = calculate_confidence(
+            kb_results_count=kb_results_count,
+            temperature=temperature,
+            used_memory=used_memory,
+            response_length=len(response)
+        )
+        # Build enriched metadata with response metrics
+        enriched_metadata = {}
+        if metadata:
+            enriched_metadata.update(metadata)
+        enriched_metadata.update({
+            "confidence": round(confidence, 3),
+            "source": response_source,
+            "latency_ms": round(latency, 1),
+            "kb_results_count": kb_results_count,
+            "used_memory": used_memory,
+            "used_kb": used_kb,
+            "response_length": len(response),
+            "model": self.model,
+            "temperature": temperature
+        })
         # Save interaction
         try:
             if hasattr(self.memory, 'add_interaction'):
@@ -372,13 +842,532 @@ class MemAgent:
                     user_id=user_id,
                     user_message=message,
                     bot_response=response,
-                    metadata=metadata
+                    metadata=enriched_metadata
                 )
+                # Extract and save user info to profile
+                self._update_user_profile(user_id, message, response)
+                # Always update summary after each conversation (JSON mode)
+                if not self.use_sql and hasattr(self.memory, 'conversations'):
+                    self._update_conversation_summary(user_id)
+                    # Save summary update
+                    if user_id in self.memory.user_profiles:
+                        self.memory.save_memory(user_id)
         except Exception as e:
             self.logger.error(f"Interaction saving error: {e}")
-        return response
+        # Create response metrics object
+        chat_response = ChatResponse(
+            text=response,
+            confidence=confidence,
+            source=response_source,
+            latency=latency,
+            timestamp=datetime.now(),
+            kb_results_count=kb_results_count,
+            metadata={
+                "model": self.model,
+                "temperature": temperature,
+                "used_memory": used_memory,
+                "used_kb": used_kb,
+                "user_id": user_id
+            }
+        )
+        # Track metrics if enabled
+        if self.track_metrics:
+            self.metrics_analyzer.add_metric(chat_response)
+        # Return based on user preference
+        if return_metrics:
+            return chat_response
+        else:
+            return response
+    def chat_stream(self, message: str, user_id: Optional[str] = None, metadata: Optional[Dict] = None) -> Iterator[str]:
+        """
+        Chat with user using streaming response (real-time)
+        This method streams the response as it's generated, providing a better UX
+        for longer responses (like ChatGPT's typing effect).
+        Args:
+            message: User's message
+            user_id: User ID (optional)
+            metadata: Additional information
+        Yields:
+            Response text chunks as they arrive from the LLM
+        Example:
+            >>> agent = MemAgent()
+            >>> agent.set_user("alice")
+            >>> for chunk in agent.chat_stream("Python nedir?"):
+            ...     print(chunk, end='', flush=True)
+            Python bir programlama dilidir...
+        """
+        # Start timing
+        start_time = time.time()
+        # Determine user
+        if user_id:
+            self.set_user(user_id)
+        elif not self.current_user:
+            yield "Error: User ID not specified."
+            return
+        user_id = self.current_user
+        # Initialize tracking variables
+        kb_results_count = 0
+        used_kb = False
+        used_memory = False
+        # Security check (v1.1.0+) - opt-in
+        if self.enable_security and self.security_detector and self.security_sanitizer:
+            risk_level = self.security_detector.get_risk_level(message)
+            is_suspicious, patterns = self.security_detector.detect(message)
+            if risk_level in ["high", "critical"]:
+                self.logger.warning(f"🚨 Blocked {risk_level} risk input from {user_id}")
+                yield f"⚠️ Your message was blocked due to security concerns. Please rephrase your request."
+                return
+            # Sanitize input
+            message = self.security_sanitizer.sanitize(message, aggressive=(risk_level == "medium"))
+        # Check tool commands first
+        tool_result = self.tool_executor.execute_user_command(message, user_id)
+        if tool_result:
+            yield tool_result
+            return
+        # Knowledge base search (if using SQL)
+        kb_context = ""
+        if ADVANCED_AVAILABLE and isinstance(self.memory, SQLMemoryManager):
+            use_kb = True
+            kb_limit = 5
+            if hasattr(self, 'config') and self.config:
+                use_kb = self.config.get("response.use_knowledge_base", True)
+                kb_limit = self.config.get("knowledge_base.search_limit", 5)
+            if use_kb:
+                try:
+                    kb_results = self.memory.search_knowledge(query=message, limit=kb_limit)
+                    if kb_results:
+                        kb_results_count = len(kb_results)
+                        used_kb = True
+                        kb_context = "\n\n📚 RELEVANT KNOWLEDGE BASE:\n"
+                        for i, result in enumerate(kb_results, 1):
+                            kb_context += f"{i}. Q: {result['question']}\n   A: {result['answer']}\n"
+                        kb_context += "\n⚠️ USE THIS INFORMATION TO ANSWER! Be brief but accurate.\n"
+                except Exception as e:
+                    self.logger.error(f"Knowledge base search error: {e}")
+        # Get conversation history
+        messages = []
+        if self.current_system_prompt:
+            messages.append({"role": "system", "content": self.current_system_prompt})
+        # Add memory history
+        try:
+            if hasattr(self.memory, 'get_recent_conversations'):
+                recent_limit = self.config.get("response.recent_conversations_limit", 5) if hasattr(self, 'config') and self.config else 5
+                recent_convs = self.memory.get_recent_conversations(user_id, recent_limit)
+                if recent_convs:
+                    used_memory = True
+                # Add conversations in chronological order
+                for conv in recent_convs:
+                    messages.append({"role": "user", "content": conv.get('user_message', '')})
+                    messages.append({"role": "assistant", "content": conv.get('bot_response', '')})
+        except Exception as e:
+            self.logger.error(f"Memory history loading error: {e}")
+        # Add current message WITH knowledge base context (if available)
+        final_message = message
+        if kb_context:
+            final_message = f"{kb_context}\n\nUser Question: {message}"
+        messages.append({"role": "user", "content": final_message})
+        # Get streaming response from LLM
+        temperature = self.config.get("llm.temperature", 0.2) if hasattr(self, 'config') and self.config else 0.2
+        max_tokens = self.config.get("llm.max_tokens", 2000) if hasattr(self, 'config') and self.config else 2000
+        # Collect full response for saving
+        full_response = ""
+        try:
+            # Stream chunks from LLM
+            for chunk in self.llm.chat_stream(
+                messages=messages,
+                temperature=temperature,
+                max_tokens=max_tokens
+            ):
+                full_response += chunk
+                yield chunk
+        except Exception as e:
+            error_msg = f"Streaming error: {str(e)}"
+            self.logger.error(error_msg)
+            yield f"\n\n⚠️ {error_msg}"
+            return
+        # Calculate latency
+        latency = (time.time() - start_time) * 1000
+        # Determine response source
+        response_source = "model"
+        if used_memory and used_kb:
+            response_source = "hybrid"
+        elif used_kb:
+            response_source = "knowledge_base"
+        # Calculate confidence
+        confidence = calculate_confidence(
+            kb_results_count=kb_results_count,
+            temperature=temperature,
+            used_memory=used_memory,
+            response_length=len(full_response)
+        )
+        # Build enriched metadata
+        enriched_metadata = {}
+        if metadata:
+            enriched_metadata.update(metadata)
+        enriched_metadata.update({
+            "confidence": round(confidence, 3),
+            "source": response_source,
+            "latency_ms": round(latency, 1),
+            "kb_results_count": kb_results_count,
+            "used_memory": used_memory,
+            "used_kb": used_kb,
+            "response_length": len(full_response),
+            "model": self.model,
+            "temperature": temperature,
+            "streaming": True
+        })
+        # Save interaction
+        try:
+            if hasattr(self.memory, 'add_interaction'):
+                self.memory.add_interaction(
+                    user_id=user_id,
+                    user_message=message,
+                    bot_response=full_response,
+                    metadata=enriched_metadata
+                )
+                # Extract and save user info to profile
+                self._update_user_profile(user_id, message, full_response)
+                # Update summary (JSON mode)
+                if not self.use_sql and hasattr(self.memory, 'conversations'):
+                    self._update_conversation_summary(user_id)
+                    if user_id in self.memory.user_profiles:
+                        self.memory.save_memory(user_id)
+        except Exception as e:
+            self.logger.error(f"Interaction saving error: {e}")
+        # Track metrics if enabled
+        if self.track_metrics:
+            chat_response = ChatResponse(
+                text=full_response,
+                confidence=confidence,
+                source=response_source,
+                latency=latency,
+                timestamp=datetime.now(),
+                kb_results_count=kb_results_count,
+                metadata={
+                    "model": self.model,
+                    "temperature": temperature,
+                    "used_memory": used_memory,
+                    "used_kb": used_kb,
+                    "user_id": user_id,
+                    "streaming": True
+                }
+            )
+            self.metrics_analyzer.add_metric(chat_response)
+    def _update_user_profile(self, user_id: str, message: str, response: str):
+        """Extract user info from conversation and update profile"""
+        msg_lower = message.lower()
+        # Extract information
+        extracted = {}
+        # Extract name
+        if "my name is" in msg_lower or "i am" in msg_lower or "i'm" in msg_lower or "adım" in msg_lower or "ismim" in msg_lower:
+            for phrase in ["my name is ", "i am ", "i'm ", "adım ", "ismim ", "benim adım "]:
+                if phrase in msg_lower:
+                    name_part = message[msg_lower.index(phrase) + len(phrase):].strip()
+                    name = name_part.split()[0] if name_part else None
+                    if name and len(name) > 1:
+                        extracted['name'] = name.strip('.,!?')
+                        break
+        # Extract favorite food
+        if "favorite food" in msg_lower or "favourite food" in msg_lower or "sevdiğim yemek" in msg_lower or "en sevdiğim" in msg_lower:
+            if "is" in msg_lower or ":" in msg_lower:
+                food = msg_lower.split("is")[-1].strip() if "is" in msg_lower else msg_lower.split(":")[-1].strip()
+                food = food.strip('.,!?')
+                if food and len(food) < 50:
+                    extracted['favorite_food'] = food
+        # Extract location
+        if "i live in" in msg_lower or "i'm from" in msg_lower or "yaşıyorum" in msg_lower or "yaşadığım" in msg_lower:
+            for phrase in ["i live in ", "i'm from ", "from ", "yaşıyorum", "yaşadığım yer", "yaşadığım şehir"]:
+                if phrase in msg_lower:
+                    loc = message[msg_lower.index(phrase) + len(phrase):].strip()
+                    location = loc.split()[0] if loc else None
+                    if location and len(location) > 2:
+                        extracted['location'] = location.strip('.,!?')
+                        break
+        # Save updates
+        if extracted:
+            try:
+                # SQL memory - store in preferences JSON
+                if hasattr(self.memory, 'update_user_profile'):
+                    # Get current profile
+                    profile = self.memory.get_user_profile(user_id) or {}
+                    # Update name directly if extracted
+                    updates = {}
+                    if 'name' in extracted:
+                        updates['name'] = extracted.pop('name')
+                    # Store other info in preferences
+                    if extracted:
+                        current_prefs = profile.get('preferences')
+                        if current_prefs:
+                            try:
+                                prefs = json.loads(current_prefs) if isinstance(current_prefs, str) else current_prefs
+                            except:
+                                prefs = {}
+                        else:
+                            prefs = {}
+                        prefs.update(extracted)
+                        updates['preferences'] = json.dumps(prefs)
+                    if updates:
+                        self.memory.update_user_profile(user_id, updates)
+                        self.logger.debug(f"Profile updated for {user_id}: {extracted}")
+                # JSON memory - direct update
+                elif hasattr(self.memory, 'update_profile'):
+                    # Load memory if not already loaded
+                    if user_id not in self.memory.user_profiles:
+                        self.memory.load_memory(user_id)
+                    # For JSON memory, merge into preferences
+                    current_profile = self.memory.user_profiles.get(user_id, {})
+                    current_prefs = current_profile.get('preferences', {})
+                    # Handle case where preferences might be a JSON string
+                    if isinstance(current_prefs, str):
+                        try:
+                            current_prefs = json.loads(current_prefs)
+                        except:
+                            current_prefs = {}
+                    # Update preferences
+                    if extracted:
+                        current_prefs.update(extracted)
+                        self.memory.user_profiles[user_id]['preferences'] = current_prefs
+                    # Update name if extracted
+                    if 'name' in extracted:
+                        self.memory.user_profiles[user_id]['name'] = extracted['name']
+                    # Auto-generate summary from conversation history
+                    self._update_conversation_summary(user_id)
+                    # Save to disk
+                    self.memory.save_memory(user_id)
+                    self.logger.debug(f"Profile updated for {user_id}: {extracted}")
+            except Exception as e:
+                self.logger.error(f"Error updating profile: {e}")
+    def _update_conversation_summary(self, user_id: str) -> None:
+        """
+        Auto-generate conversation summary for user profile
+        Args:
+            user_id: User ID
+        """
+        try:
+            if not hasattr(self.memory, 'conversations'):
+                return
+            # Ensure memory is loaded
+            if user_id not in self.memory.conversations:
+                self.memory.load_memory(user_id)
+            conversations = self.memory.conversations.get(user_id, [])
+            if not conversations:
+                return
+            # Get recent conversations for summary
+            recent_convs = conversations[-10:]  # Last 10 conversations
+            # Extract topics/interests
+            all_messages = " ".join([c.get('user_message', '') for c in recent_convs])
+            topics = self._extract_topics(all_messages)
+            # Calculate engagement stats
+            total_interactions = len(conversations)
+            avg_response_length = sum(len(c.get('bot_response', '')) for c in recent_convs) / len(recent_convs) if recent_convs else 0
+            # Build summary
+            summary = {
+                "total_interactions": total_interactions,
+                "topics_of_interest": topics[:5] if topics else [],  # Top 5 topics
+                "avg_response_length": round(avg_response_length, 0),
+                "last_active": recent_convs[-1].get('timestamp') if recent_convs else None,
+                "engagement_level": "high" if total_interactions > 20 else ("medium" if total_interactions > 5 else "low")
+            }
+            # Update profile summary (JSON mode)
+            if user_id in self.memory.user_profiles:
+                self.memory.user_profiles[user_id]['summary'] = summary
+        except Exception as e:
+            self.logger.debug(f"Summary generation skipped: {e}")
+    def _extract_topics(self, text: str) -> List[str]:
+        """
+        Extract key topics/interests from conversation text
+        Args:
+            text: Combined conversation text
+        Returns:
+            List of extracted topics
+        """
+        # Simple keyword extraction (can be enhanced with NLP)
+        keywords_map = {
+            "python": "Python Programming",
+            "javascript": "JavaScript",
+            "coding": "Programming",
+            "weather": "Weather",
+            "food": "Food & Dining",
+            "music": "Music",
+            "sport": "Sports",
+            "travel": "Travel",
+            "work": "Work",
+            "help": "Support",
+            "problem": "Problem Solving",
+            "question": "Questions",
+            "chat": "Chatting"
+        }
+        text_lower = text.lower()
+        found_topics = []
+        for keyword, topic in keywords_map.items():
+            if keyword in text_lower:
+                found_topics.append(topic)
+        # Remove duplicates while preserving order
+        seen = set()
+        unique_topics = []
+        for topic in found_topics:
+            if topic not in seen:
+                seen.add(topic)
+                unique_topics.append(topic)
+        return unique_topics
+    def get_user_profile(self, user_id: Optional[str] = None) -> Dict:
+        """
+        Get user's profile info
+        Args:
+            user_id: User ID (uses current_user if not specified)
+        Returns:
+            User profile dictionary with all info (name, favorite_food, location, etc.)
+        """
+        uid = user_id or self.current_user
+        if not uid:
+            return {}
+        try:
+            # Check if SQL or JSON memory - SQL has SQLMemoryManager type
+            if ADVANCED_AVAILABLE and isinstance(self.memory, SQLMemoryManager):
+                # SQL memory - merge preferences into main dict
+                profile = self.memory.get_user_profile(uid)
+                if not profile:
+                    return {}
+                # Parse preferences JSON if exists
+                result = {
+                    'user_id': profile.get('user_id'),
+                    'name': profile.get('name'),
+                    'first_seen': profile.get('first_seen'),
+                    'last_interaction': profile.get('last_interaction'),
+                }
+                # Merge preferences
+                prefs_str = profile.get('preferences')
+                if prefs_str:
+                    try:
+                        prefs = json.loads(prefs_str) if isinstance(prefs_str, str) else prefs_str
+                        result.update(prefs)  # Add favorite_food, location, etc.
+                    except:
+                        pass
+                return result
+            else:
+                # JSON memory - reload from disk to get latest data
+                memory_data = self.memory.load_memory(uid)
+                profile = memory_data.get('profile', {}).copy()  # Make a copy to avoid modifying cached data
+                # Parse preferences if it's a JSON string
+                if isinstance(profile.get('preferences'), str):
+                    try:
+                        profile['preferences'] = json.loads(profile['preferences'])
+                    except:
+                        profile['preferences'] = {}
+                # Return profile as-is (summary should already be there if it was generated)
+                # Only regenerate if truly missing
+                summary_value = profile.get('summary')
+                summary_is_empty = (not summary_value or
+                                   (isinstance(summary_value, dict) and len(summary_value) == 0))
+                if summary_is_empty:
+                    # Try to regenerate summary if missing (for old users)
+                    # Ensure conversations are loaded
+                    if uid not in self.memory.conversations:
+                        self.memory.load_memory(uid)
+                    if uid in self.memory.conversations and len(self.memory.conversations[uid]) > 0:
+                        self._update_conversation_summary(uid)
+                        # Save the updated summary
+                        if uid in self.memory.user_profiles:
+                            self.memory.save_memory(uid)
+                        # Reload to get updated summary
+                        memory_data = self.memory.load_memory(uid)
+                        profile = memory_data.get('profile', {}).copy()
+                        # Parse preferences again after reload
+                        if isinstance(profile.get('preferences'), str):
+                            try:
+                                profile['preferences'] = json.loads(profile['preferences'])
+                            except:
+                                profile['preferences'] = {}
+                return profile
+        except Exception as e:
+            self.logger.error(f"Error getting user profile: {e}")
+            return {}
     def add_knowledge(self, category: str, question: str, answer: str,
                      keywords: Optional[List[str]] = None, priority: int = 0) -> int:
         """Add new record to knowledge base"""
@@ -505,6 +1494,108 @@ class MemAgent:
             return self.tool_executor.memory_tools.list_available_tools()
         else:
             return "Tool system not available."
+    # === METRICS & ANALYTICS METHODS (v1.3.1+) ===
+    def get_response_metrics(self, last_n: Optional[int] = None) -> Dict[str, Any]:
+        """
+        Get response quality metrics summary
+        Args:
+            last_n: Analyze only last N responses (None = all)
+        Returns:
+            Metrics summary dictionary
+        Example:
+            >>> agent.get_response_metrics(last_n=10)
+            {
+                'total_responses': 10,
+                'avg_latency_ms': 245.3,
+                'avg_confidence': 0.82,
+                'kb_usage_rate': 0.6,
+                'source_distribution': {'knowledge_base': 6, 'model': 4},
+                'fast_response_rate': 0.9
+            }
+        """
+        return self.metrics_analyzer.get_summary(last_n)
+    def get_latest_response_metric(self) -> Optional[ChatResponse]:
+        """
+        Get the most recent response metric
+        Returns:
+            Latest ChatResponse object or None if no metrics
+        """
+        if not self.metrics_analyzer.metrics_history:
+            return None
+        return self.metrics_analyzer.metrics_history[-1]
+    def get_average_confidence(self, last_n: Optional[int] = None) -> float:
+        """
+        Get average confidence score
+        Args:
+            last_n: Analyze only last N responses (None = all)
+        Returns:
+            Average confidence (0.0-1.0)
+        """
+        return self.metrics_analyzer.get_average_confidence(last_n)
+    def get_kb_usage_rate(self, last_n: Optional[int] = None) -> float:
+        """
+        Get knowledge base usage rate
+        Args:
+            last_n: Analyze only last N responses (None = all)
+        Returns:
+            KB usage rate (0.0-1.0)
+        """
+        return self.metrics_analyzer.get_kb_usage_rate(last_n)
+    def clear_metrics(self) -> None:
+        """Clear all metrics history"""
+        self.metrics_analyzer.clear_history()
+        self.logger.info("Metrics history cleared")
+    def export_metrics(self, format: str = "json") -> str:
+        """
+        Export metrics data
+        Args:
+            format: Export format ('json' or 'summary')
+        Returns:
+            Formatted metrics data
+        """
+        summary = self.get_response_metrics()
+        if format == "json":
+            return json.dumps(summary, ensure_ascii=False, indent=2)
+        elif format == "summary":
+            lines = [
+                "📊 RESPONSE METRICS SUMMARY",
+                "=" * 60,
+                f"Total Responses:      {summary['total_responses']}",
+                f"Avg Latency:          {summary['avg_latency_ms']:.1f} ms",
+                f"Avg Confidence:       {summary['avg_confidence']:.2%}",
+                f"KB Usage Rate:        {summary['kb_usage_rate']:.2%}",
+                f"Fast Response Rate:   {summary['fast_response_rate']:.2%}",
+                "",
+                "Source Distribution:",
+            ]
+            for source, count in summary['source_distribution'].items():
+                lines.append(f"  - {source:20s}: {count}")
+            lines.extend(["", "Quality Distribution:"])
+            for quality, count in summary.get('quality_distribution', {}).items():
+                lines.append(f"  - {quality:20s}: {count}")
+            return "\n".join(lines)
+        else:
+            return "Unsupported format. Use 'json' or 'summary'."
     def close(self) -> None:
         """Clean up resources"""

mem-llm 1.0.2__py3-none-any.whl → 2.1.0__py3-none-any.whl

Potentially problematic release.

mem-llm 1.0.2py3-none-any.whl → 2.1.0py3-none-any.whl