npm - agent-world - Versions diffs - 0.12.3 → 0.15.0 - Mend

agent-world 0.12.3 → 0.15.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (263) hide show

package/README.md +105 -17
package/dist/cli/commands.d.ts +7 -1
package/dist/cli/commands.js +27 -10
package/dist/cli/hitl.d.ts +9 -2
package/dist/cli/hitl.js +61 -20
package/dist/cli/index.js +250 -96
package/dist/cli/system-events.d.ts +27 -0
package/dist/cli/system-events.js +63 -0
package/dist/core/activity-tracker.d.ts +38 -2
package/dist/core/activity-tracker.d.ts.map +1 -1
package/dist/core/activity-tracker.js +62 -9
package/dist/core/activity-tracker.js.map +1 -1
package/dist/core/anthropic-direct.d.ts +2 -0
package/dist/core/anthropic-direct.d.ts.map +1 -1
package/dist/core/anthropic-direct.js +43 -1
package/dist/core/anthropic-direct.js.map +1 -1
package/dist/core/chat-constants.d.ts +12 -0
package/dist/core/chat-constants.d.ts.map +1 -1
package/dist/core/chat-constants.js +5 -0
package/dist/core/chat-constants.js.map +1 -1
package/dist/core/create-agent-tool.d.ts +28 -25
package/dist/core/create-agent-tool.d.ts.map +1 -1
package/dist/core/create-agent-tool.js +264 -141
package/dist/core/create-agent-tool.js.map +1 -1
package/dist/core/events/index.d.ts +5 -2
package/dist/core/events/index.d.ts.map +1 -1
package/dist/core/events/index.js +5 -2
package/dist/core/events/index.js.map +1 -1
package/dist/core/events/memory-manager.d.ts +26 -1
package/dist/core/events/memory-manager.d.ts.map +1 -1
package/dist/core/events/memory-manager.js +877 -72
package/dist/core/events/memory-manager.js.map +1 -1
package/dist/core/events/orchestrator.d.ts +8 -0
package/dist/core/events/orchestrator.d.ts.map +1 -1
package/dist/core/events/orchestrator.js +214 -38
package/dist/core/events/orchestrator.js.map +1 -1
package/dist/core/events/persistence.d.ts +21 -14
package/dist/core/events/persistence.d.ts.map +1 -1
package/dist/core/events/persistence.js +100 -61
package/dist/core/events/persistence.js.map +1 -1
package/dist/core/events/publishers.d.ts +13 -16
package/dist/core/events/publishers.d.ts.map +1 -1
package/dist/core/events/publishers.js +54 -55
package/dist/core/events/publishers.js.map +1 -1
package/dist/core/events/subscribers.d.ts +17 -14
package/dist/core/events/subscribers.d.ts.map +1 -1
package/dist/core/events/subscribers.js +68 -147
package/dist/core/events/subscribers.js.map +1 -1
package/dist/core/events/title-scheduler.d.ts +27 -0
package/dist/core/events/title-scheduler.d.ts.map +1 -0
package/dist/core/events/title-scheduler.js +135 -0
package/dist/core/events/title-scheduler.js.map +1 -0
package/dist/core/events/tool-bridge-logging.d.ts +4 -1
package/dist/core/events/tool-bridge-logging.d.ts.map +1 -1
package/dist/core/events/tool-bridge-logging.js +112 -13
package/dist/core/events/tool-bridge-logging.js.map +1 -1
package/dist/core/events-metadata.d.ts.map +1 -1
package/dist/core/events-metadata.js +8 -4
package/dist/core/events-metadata.js.map +1 -1
package/dist/core/export.d.ts +1 -1
package/dist/core/export.d.ts.map +1 -1
package/dist/core/export.js +2 -15
package/dist/core/export.js.map +1 -1
package/dist/core/feature-path-logging.d.ts +50 -0
package/dist/core/feature-path-logging.d.ts.map +1 -0
package/dist/core/feature-path-logging.js +130 -0
package/dist/core/feature-path-logging.js.map +1 -0
package/dist/core/file-tools.d.ts +57 -1
package/dist/core/file-tools.d.ts.map +1 -1
package/dist/core/file-tools.js +329 -29
package/dist/core/file-tools.js.map +1 -1
package/dist/core/google-direct.d.ts +6 -1
package/dist/core/google-direct.d.ts.map +1 -1
package/dist/core/google-direct.js +76 -7
package/dist/core/google-direct.js.map +1 -1
package/dist/core/heartbeat.d.ts +34 -0
package/dist/core/heartbeat.d.ts.map +1 -0
package/dist/core/heartbeat.js +153 -0
package/dist/core/heartbeat.js.map +1 -0
package/dist/core/hitl-tool.d.ts +73 -0
package/dist/core/hitl-tool.d.ts.map +1 -0
package/dist/core/hitl-tool.js +284 -0
package/dist/core/hitl-tool.js.map +1 -0
package/dist/core/hitl.d.ts +85 -8
package/dist/core/hitl.d.ts.map +1 -1
package/dist/core/hitl.js +375 -61
package/dist/core/hitl.js.map +1 -1
package/dist/core/index.d.ts +12 -7
package/dist/core/index.d.ts.map +1 -1
package/dist/core/index.js +11 -6
package/dist/core/index.js.map +1 -1
package/dist/core/llm-manager.d.ts +17 -0
package/dist/core/llm-manager.d.ts.map +1 -1
package/dist/core/llm-manager.js +335 -43
package/dist/core/llm-manager.js.map +1 -1
package/dist/core/load-skill-tool.d.ts +36 -3
package/dist/core/load-skill-tool.d.ts.map +1 -1
package/dist/core/load-skill-tool.js +807 -93
package/dist/core/load-skill-tool.js.map +1 -1
package/dist/core/logger.d.ts +14 -0
package/dist/core/logger.d.ts.map +1 -1
package/dist/core/logger.js +15 -0
package/dist/core/logger.js.map +1 -1
package/dist/core/managers.d.ts +41 -52
package/dist/core/managers.d.ts.map +1 -1
package/dist/core/managers.js +422 -533
package/dist/core/managers.js.map +1 -1
package/dist/core/mcp-server-registry.d.ts +19 -2
package/dist/core/mcp-server-registry.d.ts.map +1 -1
package/dist/core/mcp-server-registry.js +168 -12
package/dist/core/mcp-server-registry.js.map +1 -1
package/dist/core/message-cutoff.d.ts +29 -0
package/dist/core/message-cutoff.d.ts.map +1 -0
package/dist/core/message-cutoff.js +63 -0
package/dist/core/message-cutoff.js.map +1 -0
package/dist/core/message-edit-manager.d.ts +54 -0
package/dist/core/message-edit-manager.d.ts.map +1 -0
package/dist/core/message-edit-manager.js +602 -0
package/dist/core/message-edit-manager.js.map +1 -0
package/dist/core/message-prep.d.ts +2 -0
package/dist/core/message-prep.d.ts.map +1 -1
package/dist/core/message-prep.js +39 -12
package/dist/core/message-prep.js.map +1 -1
package/dist/core/message-processing-control.d.ts +1 -0
package/dist/core/message-processing-control.d.ts.map +1 -1
package/dist/core/message-processing-control.js +23 -6
package/dist/core/message-processing-control.js.map +1 -1
package/dist/core/openai-direct.d.ts +9 -3
package/dist/core/openai-direct.d.ts.map +1 -1
package/dist/core/openai-direct.js +267 -33
package/dist/core/openai-direct.js.map +1 -1
package/dist/core/optional-tracers/opik-runtime.d.ts +32 -0
package/dist/core/optional-tracers/opik-runtime.d.ts.map +1 -0
package/dist/core/optional-tracers/opik-runtime.js +141 -0
package/dist/core/optional-tracers/opik-runtime.js.map +1 -0
package/dist/core/queue-manager.d.ts +84 -0
package/dist/core/queue-manager.d.ts.map +1 -0
package/dist/core/queue-manager.js +814 -0
package/dist/core/queue-manager.js.map +1 -0
package/dist/core/reasoning-controls.d.ts +30 -0
package/dist/core/reasoning-controls.d.ts.map +1 -0
package/dist/core/reasoning-controls.js +118 -0
package/dist/core/reasoning-controls.js.map +1 -0
package/dist/core/reliability-config.d.ts +82 -0
package/dist/core/reliability-config.d.ts.map +1 -0
package/dist/core/reliability-config.js +106 -0
package/dist/core/reliability-config.js.map +1 -0
package/dist/core/reliability-runtime.d.ts +53 -0
package/dist/core/reliability-runtime.d.ts.map +1 -0
package/dist/core/reliability-runtime.js +92 -0
package/dist/core/reliability-runtime.js.map +1 -0
package/dist/core/security/guardrails.d.ts +21 -0
package/dist/core/security/guardrails.d.ts.map +1 -0
package/dist/core/security/guardrails.js +111 -0
package/dist/core/security/guardrails.js.map +1 -0
package/dist/core/send-message-tool.d.ts +79 -0
package/dist/core/send-message-tool.d.ts.map +1 -0
package/dist/core/send-message-tool.js +222 -0
package/dist/core/send-message-tool.js.map +1 -0
package/dist/core/shell-cmd-tool.d.ts +82 -1
package/dist/core/shell-cmd-tool.d.ts.map +1 -1
package/dist/core/shell-cmd-tool.js +854 -42
package/dist/core/shell-cmd-tool.js.map +1 -1
package/dist/core/skill-registry.d.ts +2 -0
package/dist/core/skill-registry.d.ts.map +1 -1
package/dist/core/skill-registry.js +52 -2
package/dist/core/skill-registry.js.map +1 -1
package/dist/core/storage/eventStorage/fileEventStorage.d.ts +5 -0
package/dist/core/storage/eventStorage/fileEventStorage.d.ts.map +1 -1
package/dist/core/storage/eventStorage/fileEventStorage.js +61 -0
package/dist/core/storage/eventStorage/fileEventStorage.js.map +1 -1
package/dist/core/storage/eventStorage/memoryEventStorage.d.ts +5 -0
package/dist/core/storage/eventStorage/memoryEventStorage.d.ts.map +1 -1
package/dist/core/storage/eventStorage/memoryEventStorage.js +34 -0
package/dist/core/storage/eventStorage/memoryEventStorage.js.map +1 -1
package/dist/core/storage/eventStorage/sqliteEventStorage.d.ts +1 -0
package/dist/core/storage/eventStorage/sqliteEventStorage.d.ts.map +1 -1
package/dist/core/storage/eventStorage/sqliteEventStorage.js +19 -2
package/dist/core/storage/eventStorage/sqliteEventStorage.js.map +1 -1
package/dist/core/storage/eventStorage/types.d.ts +6 -0
package/dist/core/storage/eventStorage/types.d.ts.map +1 -1
package/dist/core/storage/eventStorage/types.js +1 -0
package/dist/core/storage/eventStorage/types.js.map +1 -1
package/dist/core/storage/eventStorage/validation.d.ts.map +1 -1
package/dist/core/storage/eventStorage/validation.js +2 -1
package/dist/core/storage/eventStorage/validation.js.map +1 -1
package/dist/core/storage/github-world-import.d.ts +84 -0
package/dist/core/storage/github-world-import.d.ts.map +1 -0
package/dist/core/storage/github-world-import.js +365 -0
package/dist/core/storage/github-world-import.js.map +1 -0
package/dist/core/storage/memory-storage.d.ts +19 -8
package/dist/core/storage/memory-storage.d.ts.map +1 -1
package/dist/core/storage/memory-storage.js +147 -49
package/dist/core/storage/memory-storage.js.map +1 -1
package/dist/core/storage/queue-storage.d.ts +1 -0
package/dist/core/storage/queue-storage.d.ts.map +1 -1
package/dist/core/storage/queue-storage.js +3 -2
package/dist/core/storage/queue-storage.js.map +1 -1
package/dist/core/storage/sqlite-storage.d.ts +14 -9
package/dist/core/storage/sqlite-storage.d.ts.map +1 -1
package/dist/core/storage/sqlite-storage.js +131 -154
package/dist/core/storage/sqlite-storage.js.map +1 -1
package/dist/core/storage/storage-factory.d.ts +3 -0
package/dist/core/storage/storage-factory.d.ts.map +1 -1
package/dist/core/storage/storage-factory.js +175 -89
package/dist/core/storage/storage-factory.js.map +1 -1
package/dist/core/storage/world-storage.d.ts +1 -1
package/dist/core/storage/world-storage.d.ts.map +1 -1
package/dist/core/storage/world-storage.js +5 -1
package/dist/core/storage/world-storage.js.map +1 -1
package/dist/core/storage-init.d.ts +11 -0
package/dist/core/storage-init.d.ts.map +1 -0
package/dist/core/storage-init.js +122 -0
package/dist/core/storage-init.js.map +1 -0
package/dist/core/subscription.d.ts +8 -1
package/dist/core/subscription.d.ts.map +1 -1
package/dist/core/subscription.js +130 -23
package/dist/core/subscription.js.map +1 -1
package/dist/core/tool-approval.d.ts +45 -0
package/dist/core/tool-approval.d.ts.map +1 -0
package/dist/core/tool-approval.js +223 -0
package/dist/core/tool-approval.js.map +1 -0
package/dist/core/tool-execution-envelope.d.ts +87 -0
package/dist/core/tool-execution-envelope.d.ts.map +1 -0
package/dist/core/tool-execution-envelope.js +168 -0
package/dist/core/tool-execution-envelope.js.map +1 -0
package/dist/core/tool-utils.d.ts +9 -2
package/dist/core/tool-utils.d.ts.map +1 -1
package/dist/core/tool-utils.js +122 -28
package/dist/core/tool-utils.js.map +1 -1
package/dist/core/types.d.ts +69 -36
package/dist/core/types.d.ts.map +1 -1
package/dist/core/types.js +3 -2
package/dist/core/types.js.map +1 -1
package/dist/core/utils.d.ts +16 -0
package/dist/core/utils.d.ts.map +1 -1
package/dist/core/utils.js +99 -24
package/dist/core/utils.js.map +1 -1
package/dist/core/web-fetch-tool.d.ts +72 -0
package/dist/core/web-fetch-tool.d.ts.map +1 -0
package/dist/core/web-fetch-tool.js +491 -0
package/dist/core/web-fetch-tool.js.map +1 -0
package/dist/core/world-registry.d.ts +84 -0
package/dist/core/world-registry.d.ts.map +1 -0
package/dist/core/world-registry.js +247 -0
package/dist/core/world-registry.js.map +1 -0
package/dist/public/assets/index-Be-1xtV-.js +104 -0
package/dist/public/assets/index-tsDdiXDU.css +1 -0
package/dist/public/index.html +2 -2
package/dist/public/mcp-sandbox-proxy.html +148 -0
package/dist/server/api.js +288 -58
package/dist/server/error-response.d.ts +27 -0
package/dist/server/error-response.js +77 -0
package/dist/server/index.d.ts +2 -1
package/dist/server/index.js +6 -2
package/dist/server/sse-handler.d.ts +13 -2
package/dist/server/sse-handler.js +194 -26
package/migrations/0015_add_message_queue.sql +36 -0
package/migrations/0016_add_world_heartbeat.sql +13 -0
package/migrations/0017_add_title_provenance.sql +7 -0
package/package.json +31 -10
package/dist/public/assets/index-BO20H4xt.js +0 -96
package/dist/public/assets/index-ETY7W5_S.css +0 -1

package/dist/core/llm-manager.js CHANGED Viewed

@@ -94,6 +94,16 @@
  * - Queue-based serialization prevents API rate limits and resource conflicts
  *
  * Recent Changes:
+ * - 2026-03-13: Added streamed `reasoningContent` forwarding and world-variable reasoning-effort propagation for OpenAI-compatible and Google direct providers.
+ * - 2026-03-06: Moved `shell_cmd` working-directory prompt guidance into tool-aware system-message injection.
+ * - 2026-03-06: Widened queue timeout field typing to `number` so runtime timeout overrides compile cleanly.
+ * - 2026-03-05: Added chat-scoped LLM timeout status system events (`taking too long` warning + hard-timeout event), enforced timeout-triggered abort signaling in queue processing, and classified queue timeouts separately from user cancellations.
+ * - 2026-03-05: Switched LLM queue timeout defaults to shared reliability config.
+ * - 2026-03-04: Azure client creation now maps `agent.model` to Azure deployment name (with config deployment fallback) so world/agent model selection controls deployment URL routing.
+ * - 2026-02-28: Added canonical feature-path diagnostics (`llm.prep`, `llm.request.*`, `llm.response.*`) with opt-in raw payload logging and correlation metadata.
+ * - 2026-02-24: Required explicit chatId for streaming SSE emission and propagated chatId through start/chunk/end/error events for strict chat-scoped frontend filtering.
+ * - 2026-02-20: Switched injected tool-usage guidance to shared `buildToolUsagePromptSection()` so HITL and other tool rules are centralized in one utility.
+ * - 2026-02-20: Updated injected tool-usage guidance to direct LLMs to use `human_intervention_request` for human clarifications and confirmations.
  * - 2026-02-13: Reclassified stop-triggered aborts as cancellation/info logs (not errors) in queue and non-streaming paths.
  * - 2026-02-13: Added merged external+queue abort-signal support so chat stop requests can cancel follow-up continuation calls.
  * - 2026-02-13: Added chat-scoped LLM cancellation controls so Electron stop requests can abort active and queued calls by `worldId` + `chatId`.
@@ -117,9 +127,11 @@ import { filterClientSideMessages } from './message-prep.js';
 import { createClientForProvider, streamOpenAIResponse, generateOpenAIResponse } from './openai-direct.js';
 import { createAnthropicClientForAgent, streamAnthropicResponse, generateAnthropicResponse } from './anthropic-direct.js';
 import { createGoogleClientForAgent, streamGoogleResponse, generateGoogleResponse } from './google-direct.js';
-import { generateId } from './utils.js';
+import { buildToolUsagePromptSection, generateId, getDefaultWorkingDirectory, getEnvValueFromText } from './utils.js';
 import { createCategoryLogger } from './logger.js';
+import { buildFeaturePathCorrelation, mergeFeaturePathData, sanitizeRawPayloadForLog, shouldEmitRawLog } from './feature-path-logging.js';
 import { createStorageWithWrappers } from './storage/storage-factory.js';
+import { RELIABILITY_CONFIG } from './reliability-config.js';
 // Granular function-specific loggers for detailed debugging control
 const loggerQueue = createCategoryLogger('llm.queue');
 const loggerStreaming = createCategoryLogger('llm.streaming');
@@ -127,6 +139,11 @@ const loggerGeneration = createCategoryLogger('llm.generation');
 const loggerProvider = createCategoryLogger('llm.provider');
 const loggerMCP = createCategoryLogger('llm.mcp');
 const loggerUtil = createCategoryLogger('llm.util');
+const loggerPrep = createCategoryLogger('llm.prep');
+const loggerRequestMeta = createCategoryLogger('llm.request.meta');
+const loggerRequestRaw = createCategoryLogger('llm.request.raw');
+const loggerResponseMeta = createCategoryLogger('llm.response.meta');
+const loggerResponseRaw = createCategoryLogger('llm.response.raw');
 import { getLLMProviderConfig } from './llm-config.js';
 // LLM Integration Utilities
 function stripCustomFields(message) {
@@ -142,17 +159,90 @@ function stripCustomFieldsFromMessages(messages) {
     // Then strip custom fields
     return filteredMessages.map(stripCustomFields);
 }
+function summarizeMessagesForLLM(messages) {
+    return {
+        messageCount: messages.length,
+        systemMessages: messages.filter(m => m.role === 'system').length,
+        userMessages: messages.filter(m => m.role === 'user').length,
+        assistantMessages: messages.filter(m => m.role === 'assistant').length,
+        toolMessages: messages.filter(m => m.role === 'tool').length,
+    };
+}
+function emitLLMRequestDiagnostics(params) {
+    const correlation = buildFeaturePathCorrelation({
+        worldId: params.world.id,
+        chatId: params.chatId,
+        agentId: params.agent.id,
+        messageId: params.messageId,
+        turnId: params.messageId,
+    });
+    const messageSummary = summarizeMessagesForLLM(params.preparedMessages);
+    const toolNames = Object.keys(params.mcpTools);
+    loggerPrep.debug('Prepared messages for LLM request', mergeFeaturePathData(correlation, {
+        ...messageSummary,
+        toolCount: toolNames.length,
+    }));
+    loggerRequestMeta.debug('LLM request ready', mergeFeaturePathData(correlation, {
+        provider: params.agent.provider,
+        model: params.agent.model,
+        ...messageSummary,
+        toolCount: toolNames.length,
+        toolNames,
+    }));
+    if (shouldEmitRawLog('llm.request.raw')) {
+        loggerRequestRaw.debug('LLM request payload', mergeFeaturePathData(correlation, {
+            provider: params.agent.provider,
+            model: params.agent.model,
+            payload: sanitizeRawPayloadForLog({
+                messages: params.preparedMessages,
+                tools: params.mcpTools,
+            }),
+        }));
+    }
+}
+function emitLLMResponseDiagnostics(params) {
+    const correlation = buildFeaturePathCorrelation({
+        worldId: params.world.id,
+        chatId: params.chatId,
+        agentId: params.agent.id,
+        messageId: params.messageId,
+        turnId: params.messageId,
+    });
+    loggerResponseMeta.debug('LLM response received', mergeFeaturePathData(correlation, {
+        provider: params.agent.provider,
+        model: params.agent.model,
+        responseType: params.response.type,
+        contentLength: params.response.content?.length || 0,
+        toolCallCount: params.response.tool_calls?.length || 0,
+    }));
+    if (shouldEmitRawLog('llm.response.raw')) {
+        loggerResponseRaw.debug('LLM response payload', mergeFeaturePathData(correlation, {
+            provider: params.agent.provider,
+            model: params.agent.model,
+            payload: sanitizeRawPayloadForLog(params.response),
+        }));
+    }
+}
 /**
  * Append tool usage guidance to system message when tools are available
  * Returns a new array with updated system message (doesn't mutate original)
  */
-function appendToolRulesToSystemMessage(messages, hasMCPTools) {
-    if (!hasMCPTools || messages.length === 0 || messages[0].role !== 'system') {
+export function appendToolRulesToSystemMessage(messages, toolNames, options) {
+    if (messages.length === 0 || messages[0].role !== 'system') {
         return messages;
     }
     const systemMessage = messages[0];
-    // Simple guidance: Only use tools when user explicitly requests an action
-    const toolRules = '\n\nYou have access to tools. Use them only when the user explicitly requests an action.';
+    const normalizedToolNames = new Set(toolNames.map((toolName) => String(toolName || '').trim().toLowerCase()).filter(Boolean));
+    const toolUsageSection = buildToolUsagePromptSection({ toolNames });
+    const workingDirectory = typeof options?.workingDirectory === 'string' ? options.workingDirectory.trim() : '';
+    const shellExecutionRule = normalizedToolNames.has('shell_cmd') && workingDirectory
+        ? 'When using `shell_cmd`, execute commands only within this trusted working directory scope: ' + workingDirectory
+        : '';
+    const injectedSections = [shellExecutionRule, toolUsageSection].filter(Boolean);
+    if (injectedSections.length === 0) {
+        return messages;
+    }
+    const toolRules = `\n\n${injectedSections.join('\n\n')}`;
     return [
         { ...systemMessage, content: systemMessage.content + toolRules },
         ...messages.slice(1)
@@ -171,13 +261,25 @@ function normalizeChatId(chatId) {
         return '__none__';
     return String(chatId);
 }
+function createLLMQueueTimeoutError(agentId, timeoutMs) {
+    const error = new Error(`LLM call timeout after ${timeoutMs}ms for agent ${agentId}`);
+    error.name = 'LLMQueueTimeoutError';
+    error.code = 'LLM_QUEUE_TIMEOUT';
+    return error;
+}
+function isLLMQueueTimeoutError(error) {
+    return Boolean(error &&
+        typeof error === 'object' &&
+        'code' in error &&
+        error.code === 'LLM_QUEUE_TIMEOUT');
+}
 class LLMQueue {
     queue = [];
     processing = false;
     activeItem = null;
     maxQueueSize = 100; // Prevent memory issues
-    processingTimeoutMs = 900000; // 15 minute max processing time per call (for long-running tools)
-    async add(agentId, worldId, chatId, task) {
+    processingTimeoutMs = RELIABILITY_CONFIG.llm.processingTimeoutMs; // 15 minute max processing time per call (for long-running tools)
+    async add(agentId, worldId, chatId, task, options) {
         // Prevent queue overflow
         if (this.queue.length >= this.maxQueueSize) {
             throw new Error(`LLM queue is full (${this.maxQueueSize} items). Please try again later.`);
@@ -192,6 +294,8 @@ class LLMQueue {
                 abortController: new AbortController(),
                 canceled: false,
                 execute: task,
+                onTakingTooLong: options?.onTakingTooLong,
+                onTimedOut: options?.onTimedOut,
                 resolve,
                 reject
             };
@@ -214,13 +318,13 @@ class LLMQueue {
                 this.activeItem = item;
                 const taskStartTime = Date.now();
                 loggerQueue.debug(`LLMQueue: Processing task for agent=${item.agentId}, world=${item.worldId}, chat=${normalizeChatId(item.chatId)}, queueItemId=${item.id}`);
-                // Add processing timeout to prevent stuck queue
+                // Add processing timeout to prevent stuck queue.
                 const processPromise = item.execute(item.abortController.signal);
-                // Store timeout ID so we can cancel it if process completes first
+                // Store timeout IDs so we can cancel them on all exits.
                 let timeoutId;
                 let warningTimeoutId;
-                // Warn if processing takes more than 50% of timeout
-                const warningThreshold = this.processingTimeoutMs * 0.5;
+                // Warn if processing exceeds configured threshold ratio of timeout.
+                const warningThreshold = this.processingTimeoutMs * RELIABILITY_CONFIG.llm.warningThresholdRatio;
                 warningTimeoutId = setTimeout(() => {
                     const elapsed = Date.now() - taskStartTime;
                     loggerQueue.warn(`LLM task is taking longer than expected`, {
@@ -230,22 +334,74 @@ class LLMQueue {
                         timeoutMs: this.processingTimeoutMs,
                         percentComplete: Math.round((elapsed / this.processingTimeoutMs) * 100)
                     });
+                    try {
+                        item.onTakingTooLong?.({
+                            elapsedMs: elapsed,
+                            timeoutMs: this.processingTimeoutMs,
+                        });
+                    }
+                    catch (callbackError) {
+                        loggerQueue.warn('LLM queue taking-too-long callback failed', {
+                            agentId: item.agentId,
+                            worldId: item.worldId,
+                            chatId: normalizeChatId(item.chatId),
+                            queueItemId: item.id,
+                            error: callbackError instanceof Error ? callbackError.message : String(callbackError)
+                        });
+                    }
                 }, warningThreshold);
                 const timeoutPromise = new Promise((_, reject) => {
                     timeoutId = setTimeout(() => {
-                        reject(new Error(`LLM call timeout after ${this.processingTimeoutMs}ms for agent ${item.agentId}`));
+                        const elapsed = Date.now() - taskStartTime;
+                        if (!item.abortController.signal.aborted) {
+                            item.abortController.abort();
+                        }
+                        try {
+                            item.onTimedOut?.({
+                                elapsedMs: elapsed,
+                                timeoutMs: this.processingTimeoutMs,
+                            });
+                        }
+                        catch (callbackError) {
+                            loggerQueue.warn('LLM queue timeout callback failed', {
+                                agentId: item.agentId,
+                                worldId: item.worldId,
+                                chatId: normalizeChatId(item.chatId),
+                                queueItemId: item.id,
+                                error: callbackError instanceof Error ? callbackError.message : String(callbackError)
+                            });
+                        }
+                        reject(createLLMQueueTimeoutError(item.agentId, this.processingTimeoutMs));
                     }, this.processingTimeoutMs);
                 });
-                const result = await Promise.race([processPromise, timeoutPromise]);
-                // Clear both timeouts to prevent Jest from hanging
-                clearTimeout(timeoutId);
-                clearTimeout(warningTimeoutId);
+                let result;
+                try {
+                    result = await Promise.race([processPromise, timeoutPromise]);
+                }
+                finally {
+                    if (timeoutId) {
+                        clearTimeout(timeoutId);
+                    }
+                    if (warningTimeoutId) {
+                        clearTimeout(warningTimeoutId);
+                    }
+                }
                 item.resolve(result);
                 loggerQueue.debug(`LLMQueue: Finished processing task for agent=${item.agentId}, world=${item.worldId}, queueItemId=${item.id}`);
             }
             catch (error) {
-                const wasCanceled = item.canceled || item.abortController.signal.aborted || isAbortError(error);
-                if (wasCanceled) {
+                const isTimeout = isLLMQueueTimeoutError(error);
+                const wasCanceled = !isTimeout && (item.canceled || item.abortController.signal.aborted || isAbortError(error));
+                if (isTimeout) {
+                    loggerQueue.warn('LLM queue call timed out', {
+                        agentId: item.agentId,
+                        worldId: item.worldId,
+                        chatId: normalizeChatId(item.chatId),
+                        queueItemId: item.id,
+                        reason: error instanceof Error ? error.message : String(error)
+                    });
+                }
+                else if (wasCanceled) {
                     loggerQueue.info('LLM queue call canceled', {
                         agentId: item.agentId,
                         worldId: item.worldId,
@@ -322,8 +478,8 @@ class LLMQueue {
     }
     // Set processing timeout (useful for testing or adjusting for long-running operations)
     setProcessingTimeout(timeoutMs) {
-        if (timeoutMs < 1000) {
-            throw new Error('Processing timeout must be at least 1000ms');
+        if (timeoutMs < RELIABILITY_CONFIG.llm.minProcessingTimeoutMs) {
+            throw new Error(`Processing timeout must be at least ${RELIABILITY_CONFIG.llm.minProcessingTimeoutMs}ms`);
         }
         this.processingTimeoutMs = timeoutMs;
         loggerQueue.info('LLM queue processing timeout updated', { timeoutMs });
@@ -345,6 +501,18 @@ function isAbortError(error) {
     const message = error instanceof Error ? error.message : String(error);
     return message.toLowerCase().includes('abort');
 }
+function emitLLMTimeoutSystemStatus(world, chatId, content) {
+    const scopedChatId = typeof chatId === 'string' ? chatId.trim() : '';
+    if (!scopedChatId) {
+        return;
+    }
+    world.eventEmitter.emit('system', {
+        content,
+        timestamp: new Date(),
+        messageId: generateId(),
+        chatId: scopedChatId,
+    });
+}
 function createCombinedAbortSignal(first, second) {
     const signals = [first, second].filter((value) => Boolean(value));
     if (signals.length === 0) {
@@ -380,24 +548,36 @@ export async function streamAgentResponse(world, agent, messages, publishSSE, ch
     if (abortSignal?.aborted) {
         throw new DOMException(`LLM call aborted before queue for agent ${agent.id}`, 'AbortError');
     }
+    const normalizedChatId = typeof chatId === 'string' ? chatId.trim() : '';
+    const resolvedChatId = normalizedChatId || null;
+    if (!resolvedChatId) {
+        throw new Error(`streamAgentResponse: chatId is required for agent ${agent.id}`);
+    }
     // Queue the LLM call to ensure serialized execution
-    return llmQueue.add(agent.id, world.id, chatId, async (queueAbortSignal) => {
+    return llmQueue.add(agent.id, world.id, resolvedChatId, async (queueAbortSignal) => {
         const { signal: mergedAbortSignal, dispose } = createCombinedAbortSignal(queueAbortSignal, abortSignal);
         try {
             if (mergedAbortSignal?.aborted) {
                 throw new DOMException(`LLM call aborted before execution for agent ${agent.id}`, 'AbortError');
             }
-            return await executeStreamAgentResponse(world, agent, messages, publishSSE, mergedAbortSignal);
+            return await executeStreamAgentResponse(world, agent, messages, publishSSE, resolvedChatId, mergedAbortSignal);
         }
         finally {
             dispose();
         }
+    }, {
+        onTakingTooLong: ({ elapsedMs, timeoutMs }) => {
+            emitLLMTimeoutSystemStatus(world, resolvedChatId, `LLM processing taking too long for ${agent.id} (elapsed ${Math.floor(elapsedMs / 1000)}s, timeout ${Math.floor(timeoutMs / 1000)}s).`);
+        },
+        onTimedOut: ({ timeoutMs }) => {
+            emitLLMTimeoutSystemStatus(world, resolvedChatId, `LLM processing timed out for ${agent.id} after ${Math.floor(timeoutMs / 1000)}s.`);
+        },
     });
 }
 /**
  * Internal streaming implementation (executed within queue)
  */
-async function executeStreamAgentResponse(world, agent, messages, publishSSE, abortSignal) {
+async function executeStreamAgentResponse(world, agent, messages, publishSSE, chatId, abortSignal) {
     const messageId = generateId();
     try {
         if (abortSignal?.aborted) {
@@ -407,7 +587,8 @@ async function executeStreamAgentResponse(world, agent, messages, publishSSE, ab
         publishSSE(world, {
             agentName: agent.id,
             type: 'start',
-            messageId
+            messageId,
+            chatId
         });
         loggerStreaming.debug(`LLM: Starting streaming response for agent=${agent.id}, world=${world.id}, messageId=${messageId}`);
         // Convert messages for LLM (strip custom fields)
@@ -415,9 +596,11 @@ async function executeStreamAgentResponse(world, agent, messages, publishSSE, ab
         let preparedMessages = stripCustomFieldsFromMessages(messages);
         // Get MCP tools for this world
         const mcpTools = await getMCPToolsForWorld(world.id);
-        const hasMCPTools = Object.keys(mcpTools).length > 0;
+        const mcpToolNames = Object.keys(mcpTools);
+        const hasMCPTools = mcpToolNames.length > 0;
+        const workingDirectory = getEnvValueFromText(world.variables, 'working_directory') || getDefaultWorkingDirectory();
         // Add tool usage instructions to system message when tools are available
-        preparedMessages = appendToolRulesToSystemMessage(preparedMessages, hasMCPTools);
+        preparedMessages = appendToolRulesToSystemMessage(preparedMessages, mcpToolNames, { workingDirectory });
         if (hasMCPTools) {
             loggerMCP.debug(`LLM: Including ${Object.keys(mcpTools).length} MCP tools for agent=${agent.id}, world=${world.id}`);
             // Debug: Log complete tool definitions being sent to LLM
@@ -430,28 +613,71 @@ async function executeStreamAgentResponse(world, agent, messages, publishSSE, ab
                 });
             }
         }
+        emitLLMRequestDiagnostics({
+            world,
+            agent,
+            chatId,
+            messageId,
+            preparedMessages,
+            mcpTools,
+        });
         // Use direct OpenAI integration for OpenAI providers
         if (isOpenAIProvider(agent.provider)) {
             const client = createOpenAIClientForAgent(agent);
-            const response = await streamOpenAIResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (content) => publishSSE(world, { agentName: agent.id, type: 'chunk', content, messageId }), messageId, abortSignal);
+            const response = await streamOpenAIResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (chunk) => publishSSE(world, {
+                agentName: agent.id,
+                type: 'chunk',
+                content: chunk.content,
+                reasoningContent: chunk.reasoningContent,
+                messageId,
+                chatId,
+            }), messageId, abortSignal);
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             // Emit end event after streaming completes
-            publishSSE(world, { agentName: agent.id, type: 'end', messageId });
+            publishSSE(world, { agentName: agent.id, type: 'end', messageId, chatId });
             return { response, messageId };
         }
         // Use direct Anthropic integration for Anthropic provider
         if (isAnthropicProvider(agent.provider)) {
             const client = createAnthropicClientForAgent(agent);
-            const response = await streamAnthropicResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (content) => publishSSE(world, { agentName: agent.id, type: 'chunk', content, messageId }), messageId, abortSignal);
+            const response = await streamAnthropicResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (content) => publishSSE(world, { agentName: agent.id, type: 'chunk', content, messageId, chatId }), messageId, abortSignal);
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             // Emit end event after streaming completes
-            publishSSE(world, { agentName: agent.id, type: 'end', messageId });
+            publishSSE(world, { agentName: agent.id, type: 'end', messageId, chatId });
             return { response, messageId };
         }
         // Use direct Google integration for Google provider
         if (isGoogleProvider(agent.provider)) {
             const client = createGoogleClientForAgent(agent);
-            const response = await streamGoogleResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (content) => publishSSE(world, { agentName: agent.id, type: 'chunk', content, messageId }), messageId, abortSignal);
+            const response = await streamGoogleResponse(client, agent.model, preparedMessages, agent, mcpTools, world, (chunk) => publishSSE(world, {
+                agentName: agent.id,
+                type: 'chunk',
+                content: chunk.content,
+                reasoningContent: chunk.reasoningContent,
+                messageId,
+                chatId,
+            }), messageId, abortSignal);
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             // Emit end event after streaming completes
-            publishSSE(world, { agentName: agent.id, type: 'end', messageId });
+            publishSSE(world, { agentName: agent.id, type: 'end', messageId, chatId });
             return { response, messageId };
         }
         // All providers now use direct integrations - no AI SDK needed
@@ -462,7 +688,8 @@ async function executeStreamAgentResponse(world, agent, messages, publishSSE, ab
             publishSSE(world, {
                 agentName: agent.id,
                 type: 'end',
-                messageId
+                messageId,
+                chatId
             });
             loggerStreaming.info(`LLM: Streaming response canceled for agent=${agent.id}, world=${world.id}, messageId=${messageId}`);
             throw new Error(`LLM call canceled for agent ${agent.id}`);
@@ -472,9 +699,16 @@ async function executeStreamAgentResponse(world, agent, messages, publishSSE, ab
             agentName: agent.id,
             type: 'error',
             error: error.message,
-            messageId
+            messageId,
+            chatId
+        });
+        loggerStreaming.error('LLM: Error during streaming response', {
+            agentId: agent.id,
+            worldId: world.id,
+            chatId,
+            messageId,
+            error: error instanceof Error ? error.message : String(error)
         });
-        loggerStreaming.error(`LLM: Error during streaming response for agent=${agent.id}, world=${world.id}, messageId=${messageId}, error=${error.message}`);
         throw error;
     }
 }
@@ -485,24 +719,36 @@ export async function generateAgentResponse(world, agent, messages, _publishSSE,
     if (abortSignal?.aborted) {
         throw new DOMException(`LLM call aborted before queue for agent ${agent.id}`, 'AbortError');
     }
+    const normalizedChatId = typeof chatId === 'string' ? chatId.trim() : '';
+    const resolvedChatId = normalizedChatId || null;
+    if (!resolvedChatId) {
+        throw new Error(`generateAgentResponse: chatId is required for agent ${agent.id}`);
+    }
     // Queue the LLM call to ensure serialized execution
-    return llmQueue.add(agent.id, world.id, chatId, async (queueAbortSignal) => {
+    return llmQueue.add(agent.id, world.id, resolvedChatId, async (queueAbortSignal) => {
         const { signal: mergedAbortSignal, dispose } = createCombinedAbortSignal(queueAbortSignal, abortSignal);
         try {
             if (mergedAbortSignal?.aborted) {
                 throw new DOMException(`LLM call aborted before execution for agent ${agent.id}`, 'AbortError');
             }
-            return await executeGenerateAgentResponse(world, agent, messages, skipTools, mergedAbortSignal);
+            return await executeGenerateAgentResponse(world, agent, messages, skipTools, resolvedChatId, mergedAbortSignal);
         }
         finally {
             dispose();
         }
+    }, {
+        onTakingTooLong: ({ elapsedMs, timeoutMs }) => {
+            emitLLMTimeoutSystemStatus(world, resolvedChatId, `LLM processing taking too long for ${agent.id} (elapsed ${Math.floor(elapsedMs / 1000)}s, timeout ${Math.floor(timeoutMs / 1000)}s).`);
+        },
+        onTimedOut: ({ timeoutMs }) => {
+            emitLLMTimeoutSystemStatus(world, resolvedChatId, `LLM processing timed out for ${agent.id} after ${Math.floor(timeoutMs / 1000)}s.`);
+        },
     });
 }
 /**
  * Internal generation implementation (executed within queue)
  */
-async function executeGenerateAgentResponse(world, agent, messages, skipTools, abortSignal) {
+async function executeGenerateAgentResponse(world, agent, messages, skipTools, chatId = null, abortSignal) {
     if (abortSignal?.aborted) {
         throw new DOMException('LLM call aborted before start', 'AbortError');
     }
@@ -512,9 +758,19 @@ async function executeGenerateAgentResponse(world, agent, messages, skipTools, a
     let preparedMessages = stripCustomFieldsFromMessages(messages);
     // Get MCP tools for this world (skip if requested, e.g., for title generation)
     const mcpTools = skipTools ? {} : await getMCPToolsForWorld(world.id);
-    const hasMCPTools = Object.keys(mcpTools).length > 0;
+    const mcpToolNames = Object.keys(mcpTools);
+    const hasMCPTools = mcpToolNames.length > 0;
+    const workingDirectory = getEnvValueFromText(world.variables, 'working_directory') || getDefaultWorkingDirectory();
     // Add tool usage instructions to system message when tools are available
-    preparedMessages = appendToolRulesToSystemMessage(preparedMessages, hasMCPTools);
+    preparedMessages = appendToolRulesToSystemMessage(preparedMessages, mcpToolNames, { workingDirectory });
+    emitLLMRequestDiagnostics({
+        world,
+        agent,
+        chatId,
+        messageId,
+        preparedMessages,
+        mcpTools,
+    });
     if (hasMCPTools) {
         loggerMCP.debug(`LLM: Including ${Object.keys(mcpTools).length} MCP tools for agent=${agent.id}, world=${world.id}`);
         // Debug: Log complete tool definitions being sent to LLM
@@ -548,6 +804,13 @@ async function executeGenerateAgentResponse(world, agent, messages, skipTools, a
             agent.lastActive = new Date();
             agent.llmCallCount++;
             agent.lastLLMCall = new Date();
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             loggerGeneration.debug(`LLM: Finished non-streaming OpenAI response for agent=${agent.id}, world=${world.id}`, {
                 responseType: response.type,
                 contentLength: response.content?.length || 0,
@@ -565,6 +828,13 @@ async function executeGenerateAgentResponse(world, agent, messages, skipTools, a
             agent.lastActive = new Date();
             agent.llmCallCount++;
             agent.lastLLMCall = new Date();
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             loggerGeneration.debug(`LLM: Finished non-streaming Anthropic response for agent=${agent.id}, world=${world.id}`, {
                 responseType: response.type,
                 contentLength: response.content?.length || 0,
@@ -582,6 +852,13 @@ async function executeGenerateAgentResponse(world, agent, messages, skipTools, a
             agent.lastActive = new Date();
             agent.llmCallCount++;
             agent.lastLLMCall = new Date();
+            emitLLMResponseDiagnostics({
+                world,
+                agent,
+                chatId,
+                messageId,
+                response,
+            });
             loggerGeneration.debug(`LLM: Finished non-streaming Google response for agent=${agent.id}, world=${world.id}`, {
                 responseType: response.type,
                 contentLength: response.content?.length || 0,
@@ -599,7 +876,13 @@ async function executeGenerateAgentResponse(world, agent, messages, skipTools, a
             loggerGeneration.info(`LLM: Non-streaming response canceled for agent=${agent.id}, world=${world.id}, messageId=${messageId}`);
             throw new Error(`LLM call canceled for agent ${agent.id}`);
         }
-        loggerGeneration.error(`LLM: Error during non-streaming response for agent=${agent.id}, world=${world.id}, error=${error.message}`);
+        loggerGeneration.error('LLM: Error during non-streaming response', {
+            agentId: agent.id,
+            worldId: world.id,
+            chatId,
+            messageId,
+            error: error instanceof Error ? error.message : String(error)
+        });
         throw error;
     }
 }
@@ -654,8 +937,17 @@ function createOpenAIClientForAgent(agent) {
     switch (agent.provider) {
         case LLMProvider.OPENAI:
             return createClientForProvider('openai', config);
-        case LLMProvider.AZURE:
-            return createClientForProvider('azure', config);
+        case LLMProvider.AZURE: {
+            const configuredDeployment = typeof config.deployment === 'string'
+                ? config.deployment.trim()
+                : '';
+            const modelDeployment = typeof agent.model === 'string' ? agent.model.trim() : '';
+            // For Azure, deployment is selected in the URL path. Prefer runtime model when provided.
+            return createClientForProvider('azure', {
+                ...config,
+                deployment: modelDeployment || configuredDeployment,
+            });
+        }
         case LLMProvider.OPENAI_COMPATIBLE:
             return createClientForProvider('openai-compatible', config);
         case LLMProvider.XAI: