PyPI - autoglm-gui - Versions diffs - 1.2.0__py3-none-any.whl → 1.3.0__py3-none-any.whl - Mend

autoglm-gui 1.2.0py3-none-any.whl → 1.3.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

AutoGLM_GUI/adb_plus/__init__.py +6 -6
AutoGLM_GUI/api/__init__.py +49 -15
AutoGLM_GUI/api/agents.py +163 -209
AutoGLM_GUI/api/dual_model.py +310 -0
AutoGLM_GUI/api/mcp.py +134 -0
AutoGLM_GUI/api/metrics.py +36 -0
AutoGLM_GUI/config_manager.py +110 -6
AutoGLM_GUI/dual_model/__init__.py +53 -0
AutoGLM_GUI/dual_model/decision_model.py +664 -0
AutoGLM_GUI/dual_model/dual_agent.py +917 -0
AutoGLM_GUI/dual_model/protocols.py +354 -0
AutoGLM_GUI/dual_model/vision_model.py +442 -0
AutoGLM_GUI/exceptions.py +75 -3
AutoGLM_GUI/metrics.py +283 -0
AutoGLM_GUI/phone_agent_manager.py +264 -14
AutoGLM_GUI/prompts.py +97 -0
AutoGLM_GUI/schemas.py +40 -9
AutoGLM_GUI/static/assets/{about-PcGX7dIG.js → about-CrBXGOgB.js} +1 -1
AutoGLM_GUI/static/assets/chat-Di2fwu8V.js +124 -0
AutoGLM_GUI/static/assets/dialog-CHJSPLHJ.js +45 -0
AutoGLM_GUI/static/assets/{index-DOt5XNhh.js → index-9IaIXvyy.js} +1 -1
AutoGLM_GUI/static/assets/index-Dt7cVkfR.js +12 -0
AutoGLM_GUI/static/assets/index-Z0uYCPOO.css +1 -0
AutoGLM_GUI/static/assets/{workflows-B1hgBC_O.js → workflows-DHadKApI.js} +1 -1
AutoGLM_GUI/static/index.html +2 -2
{autoglm_gui-1.2.0.dist-info → autoglm_gui-1.3.0.dist-info}/METADATA +11 -4
{autoglm_gui-1.2.0.dist-info → autoglm_gui-1.3.0.dist-info}/RECORD +30 -20
AutoGLM_GUI/static/assets/chat-B0FKL2ne.js +0 -124
AutoGLM_GUI/static/assets/dialog-BSNX0L1i.js +0 -45
AutoGLM_GUI/static/assets/index-BjYIY--m.css +0 -1
AutoGLM_GUI/static/assets/index-CnEYDOXp.js +0 -11
{autoglm_gui-1.2.0.dist-info → autoglm_gui-1.3.0.dist-info}/WHEEL +0 -0
{autoglm_gui-1.2.0.dist-info → autoglm_gui-1.3.0.dist-info}/entry_points.txt +0 -0
{autoglm_gui-1.2.0.dist-info → autoglm_gui-1.3.0.dist-info}/licenses/LICENSE +0 -0

AutoGLM_GUI/prompts.py ADDED Viewed

@@ -0,0 +1,97 @@
+"""MCP-specific prompts with Fail-Fast and Step Limit constraints.
+These prompts are optimized for MCP tool calls where:
+1. Tasks should be atomic and complete within 5 steps
+2. Fail-fast behavior is preferred over exploratory attempts
+3. Clear error reporting is required for the caller to handle
+"""
+from datetime import datetime
+today = datetime.today()
+weekday_names = ["星期一", "星期二", "星期三", "星期四", "星期五", "星期六", "星期日"]
+weekday = weekday_names[today.weekday()]
+formatted_date = today.strftime("%Y年%m月%d日") + " " + weekday
+MCP_SYSTEM_PROMPT_ZH = f"""
+# Context
+当前日期: {formatted_date}
+角色: 你是 Mobile UI Executor（移动端界面执行器）。
+职责: 接收上层指令，分析手机屏幕截图，输出最精准的单步操作指令。
+**当前任务步数**: current_step_count / 5
+# CRITICAL CONSTRAINTS (核心约束)
+1. **Fail Fast (快速报错)**:
+   上层指令通常包含一个明确的目标（如"点击设置按钮"）。
+   **在执行任何点击操作前，必须在屏幕上确认识别到了该元素。**
+   如果当前屏幕**根本没有**上层要求的元素，且你判断简单的滑动也无法找到它，**禁止猜测坐标**，必须立即调用 `finish` 报错。
+2. **Step Limit (步数熔断)**:
+   如果当前子任务连续操作已达 **5步** 仍未完成，立即调用 `finish` 中断。
+# Output Format
+严格 XML 格式：
+<think>
+1. **Target Check**: 上层让我找什么？屏幕上有吗？
+2. **Step Check**: 步数是否超限？
+3. **Observation**: 屏幕布局描述。
+4. **Reasoning**: 决策逻辑。
+</think>
+<answer>
+{{action}}
+</answer>
+# Action Space (API)
+## 1. 基础交互
+- do(action="Tap", element=[x,y]): 点击坐标。**严禁点击不存在的元素。**
+- do(action="Tap", element=[x,y], message="Sensitive"): 敏感点击。
+- do(action="Double Tap", element=[x,y]): 双击。
+- do(action="Long Press", element=[x,y]): 长按。
+## 2. 输入与文本
+- do(action="Type", text="string"): 在已聚焦输入框输入。
+- do(action="Type_Name", text="string"): 输入人名。
+## 3. 导航与滑动
+- do(action="Swipe", start=[x1,y1], end=[x2,y2]): 滑动。
+- do(action="Back"): 返回/关闭。
+- do(action="Home"): 回到桌面。
+- do(action="Launch", app="AppName"): 启动 App。
+## 4. 流程控制与结束
+- do(action="Wait", duration="seconds"): 等待加载。
+- do(action="Note", message="content"): 记录信息。
+- finish(message="reason"): 任务终止。
+    - *正常完成*: message="任务已完成..."
+    - *未找到元素*: message="ELEMENT_NOT_FOUND: 当前屏幕未发现'xxx'按钮/元素，无法继续执行。" (目标缺失时必填此格式)
+    - *步数超限*: message="STEP_LIMIT_EXCEEDED: 已执行5步..."
+# Execution Heuristics (执行原则)
+## A. 目标验证 (Target Verification) - 优先级最高
+1. **所见即所得**: 在输出 `Tap` 之前，问自己："我真的在截图里看到这个按钮了吗？"
+   - 如果看到了 -> 执行 `Tap`。
+   - 如果没看到，且页面已加载完毕 -> 执行 `finish(message="ELEMENT_NOT_FOUND...")`。
+   - **绝对禁止**幻视或根据经验猜测坐标。
+## B. 异常与等待
+1. **加载中**: 如果屏幕是白屏或转圈，不要报错找不到元素，请执行 `Wait`。
+2. **干扰**: 如果有弹窗挡住了目标，先点击关闭弹窗，不要直接报错。
+## C. 搜索策略
+1. **有限尝试**: 如果目标可能在屏幕下方（如列表），可以尝试 `Swipe` 一次。但如果上层指令非常具体（如"点击右上角的保存"），而该位置没有按钮，直接报错，不要滑动。
+# Thinking Example (找不到元素场景)
+Instruction: "点击'提交订单'按钮"
+Screen: 屏幕显示购物车列表，底部只有'去结算'按钮，没有'提交订单'字样。
+<think>
+1. Target Check: 目标是"提交订单"。
+2. Observation: 屏幕底部显示的是"去结算"，而不是"提交订单"。可能UI文案不匹配，或者流程还没到那一步。
+3. Reasoning: 我无法在当前视野找到指令要求的"提交订单"元素。盲目点击"去结算"可能会导致非预期行为（虽然意思相近，但应由上层决策）。根据 Fail Fast 原则，我应该上报缺失情况。
+</think>
+<answer>
+finish(message="ELEMENT_NOT_FOUND: 当前页面底部只有'去结算'按钮，未找到'提交订单'按钮，请确认下一步指令。")
+</answer>
+"""

AutoGLM_GUI/schemas.py CHANGED Viewed

@@ -319,16 +319,17 @@ class ConfigResponse(BaseModel):
     model_name: str
     api_key: str  # 返回实际值（明文）
     source: str  # "CLI arguments" | "environment variables" | "config file (...)" | "default"
+    # 双模型配置
+    dual_model_enabled: bool = False
+    decision_base_url: str = ""
+    decision_model_name: str = ""
+    decision_api_key: str = ""
+    # 思考模式
+    thinking_mode: str = "deep"  # "fast" | "deep"
     conflicts: list[dict] | None = None  # 配置冲突信息（可选）
-    # conflicts 示例：
-    # [
-    #   {
-    #     "field": "base_url",
-    #     "file_value": "http://localhost:8080/v1",
-    #     "override_value": "https://api.example.com",
-    #     "override_source": "CLI arguments"
-    #   }
-    # ]
 class ConfigSaveRequest(BaseModel):
@@ -338,6 +339,15 @@ class ConfigSaveRequest(BaseModel):
     model_name: str = "autoglm-phone-9b"
     api_key: str | None = None
+    # 双模型配置
+    dual_model_enabled: bool | None = None
+    decision_base_url: str | None = None
+    decision_model_name: str | None = None
+    decision_api_key: str | None = None
+    # 思考模式
+    thinking_mode: str | None = None  # "fast" | "deep"
     @field_validator("base_url")
     @classmethod
     def validate_base_url(cls, v: str) -> str:
@@ -357,6 +367,27 @@ class ConfigSaveRequest(BaseModel):
             raise ValueError("model_name cannot be empty")
         return v.strip()
+    @field_validator("thinking_mode")
+    @classmethod
+    def validate_thinking_mode(cls, v: str | None) -> str | None:
+        """验证 thinking_mode."""
+        if v is None:
+            return v
+        if v not in ("fast", "deep"):
+            raise ValueError("thinking_mode must be 'fast' or 'deep'")
+        return v
+    @field_validator("decision_base_url")
+    @classmethod
+    def validate_decision_base_url(cls, v: str | None) -> str | None:
+        """验证 decision_base_url 格式."""
+        if v is None or not v.strip():
+            return None
+        v = v.strip()
+        if not re.match(r"^https?://", v):
+            raise ValueError("decision_base_url must start with http:// or https://")
+        return v
 class WiFiConnectRequest(BaseModel):
     device_id: str | None = None

AutoGLM_GUI/static/assets/{about-PcGX7dIG.js → about-CrBXGOgB.js} RENAMED Viewed

	@@ -1 +1 @@
1	- import{j as o}from"./index-~~CnEYDOXp~~.js";function t(){return o.jsx("div",{className:"p-2",children:o.jsx("h3",{children:"About"})})}export{t as component};
1	+ import{j as o}from"./index-Dt7cVkfR.js";function t(){return o.jsx("div",{className:"p-2",children:o.jsx("h3",{children:"About"})})}export{t as component};

autoglm-gui 1.2.0__py3-none-any.whl → 1.3.0__py3-none-any.whl

autoglm-gui 1.2.0py3-none-any.whl → 1.3.0py3-none-any.whl