npm - myagent-ai - Versions diffs - 1.18.0 → 1.18.1 - Mend

myagent-ai 1.18.0 → 1.18.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/agents/main_agent.py CHANGED Viewed

@@ -706,46 +706,35 @@ class MainAgent(BaseAgent):
                         )
                     break
-                # [v1.16.13→17.0] 特殊处理模型不支持图片输入 — 去掉图片用纯文本重试
-                # 支持中英文错误关键词匹配（ModelScope 等国产 API 可能返回中文错误）
+                # [v1.18.0] 特殊处理模型不支持图片输入
+                # 策略: 保留图片数据，break 后让 _stream_process_message 返回 ⚠️ 标记
+                # model chain 的 _try_model_chain_stream_inner 检测到 ⚠️ 后会继续尝试下一个模型
                 _vision_keywords = [
                     "doesn't support image", "does not support image", "model_incompatible",
                     "image input", "not support vision", "unsupported multimodal", "image capability",
                     "不支持图片", "不支持图像", "图片输入", "图像输入", "不支持多模态",
                     "视觉", "image_url", "multimodal", "vision",
                 ]
-                if any(kw.lower() in _llm_error.lower() for kw in _vision_keywords) and context.metadata.get("user_images"):
-                    logger.warning(f"[{task_id}] 模型不支持图片输入，去掉图片用纯文本重试")
-                    context.metadata["user_images"] = []
-                    # 用纯文本消息替换最后一条多模态消息
-                    _text_only_msg = context.user_message or "请处理上述上下文。"
-                    if len(messages) > 0 and isinstance(messages[-1].content, list):
-                        messages[-1] = Message(role="user", content=_text_only_msg)
-                    # 重试 LLM 调用
-                    if stream_response and self.llm:
-                        response = await self._call_llm_stream(
-                            messages, text_delta_callback=text_delta_callback,
-                            stream_response=stream_response,
+                _is_vision_error = (
+                    any(kw.lower() in _llm_error.lower() for kw in _vision_keywords)
+                    and context.metadata.get("user_images")
+                )
+                if _is_vision_error:
+                    logger.warning(f"[{task_id}] 模型 {self.llm.model} 不支持图片输入，"
+                                   f"将切换到支持图片的模型重试")
+                    # 返回 ⚠️ 标记的错误，让 model chain 继续尝试下一个模型
+                    # 注意: 不清除 context.metadata["user_images"]，下一个模型仍可使用
+                    _vision_skip_msg = f"⚠️ 模型 {self.llm.model} 不支持图片，正在切换..."
+                    context.working_memory["final_response"] = _vision_skip_msg
+                    await self._emit_v2_event("v2_reasoning", {"content": _vision_skip_msg}, stream_callback)
+                    if self.memory:
+                        self.memory.add_session(
+                            session_id=context.session_id,
+                            role="assistant",
+                            content=_vision_skip_msg,
                         )
-                    else:
-                        response = await self._call_llm(messages)
-                    if response.success:
-                        # 纯文本重试成功，给回复加上提示前缀
-                        _vision_prefix = "⚠️ 当前模型不支持图片识别，已自动使用纯文本模式处理（图片未发送给模型）。\n\n"
-                        llm_raw = _vision_prefix + response.content
-                        context.working_memory["final_response"] = llm_raw
-                        await self._emit_v2_event("v2_reasoning", {"content": llm_raw}, stream_callback)
-                        if self.memory:
-                            self.memory.add_session(
-                                session_id=context.session_id,
-                                role="assistant",
-                                content=llm_raw,
-                            )
-                        break
-                    else:
-                        # 纯文本也失败了，走下面的通用错误处理
-                        _llm_error = response.error or ""
-                        logger.error(f"[{task_id}] 纯文本重试也失败: {_llm_error}")
+                    break  # 退出 agent 循环，让 model chain 尝试下一个模型
                 # 其他 LLM 错误
                 error_msg = f"LLM 调用失败: {response.error}"

package/core/vnc_manager.py CHANGED Viewed

@@ -597,6 +597,12 @@ class VNCManager:
             env = {**os.environ, "DISPLAY": self.display}
+            # [v1.18.0] proot/Termux 兼容: 可能需要额外的安全参数
+            cmd.append("-nobell")
+            cmd.append("-noxdamage")
+            # 跳过 Xinerama 检查（proot 环境下可能失败）
+            env["X11VNC_NO_UNIXPW"] = "1"
             logger.info(f"启动 x11vnc: {' '.join(cmd)}")
             self._x11vnc_process = subprocess.Popen(
                 cmd,
@@ -612,7 +618,7 @@ class VNCManager:
             if self._x11vnc_process.poll() is not None:
                 stderr = ""
                 try:
-                    stderr = self._x11vnc_process.stderr.read().decode("utf-8", errors="replace")[:500]
+                    stderr = self._x11vnc_process.stderr.read().decode("utf-8", errors="replace")[:2000]
                 except Exception:
                     pass
                 logger.error(f"x11vnc 启动失败: {stderr}")

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "myagent-ai",
-  "version": "1.18.0",
+  "version": "1.18.1",
   "description": "本地桌面端执行型AI助手 - Open Interpreter 风格 | Local Desktop Execution-Oriented AI Assistant",
   "main": "main.py",
   "bin": {