npm - braintrust-lite - Versions diffs - 0.1.9 → 0.1.11 - Mend

braintrust-lite 0.1.9 → 0.1.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "braintrust-lite",
-  "version": "0.1.9",
+  "version": "0.1.11",
   "description": "Multi-model AI consultation MCP for Claude Code — runs Claude, Codex, and Gemini in parallel for Judge-style synthesis",
   "bin": {
     "braintrust-lite": "src/server.js",

package/skills/consult/SKILL.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 name: consult
-version: 1.4.0
+version: 1.5.1
 description: 在处理规划/设计/架构/调研类任务时，并发调用 codex + gemini + claude 获取多视角，主 Claude 担任 Judge 盲评综合输出。支持渐进式多轮对话和自动更新。
 ---
@@ -71,14 +71,23 @@ curl -fsSL "https://raw.githubusercontent.com/HongjieRen/braintrust/main/skills/
 ### Judge 输出格式（必须分节，供多轮渐进加载）
-每轮 Judge 输出**强制使用以下四节**，不可合并：
+每轮 Judge 输出**强制使用以下五节**，不可合并、不可省略：
 ```
+### PERSPECTIVES
+每个模型的核心立场，**逐模型列出**，不可合并，不可说"各模型均认为"：
+- **Model A**：[该模型最核心的2-3个主张 / 独特视角，用具体措辞引用原文观点]
+- **Model B**：[同上]
+- **Model C**：[同上]
 ### VERDICT
-<核心结论，1-3句，永远保留进历史>
+<核心结论，1-3句。必须说明你采纳了哪个模型的哪个观点，以及理由>
 ### REASONING
-<关键推理和裁决依据，有追问才加载>
+<深度推理。强制要求：
+ 1. 至少引用2处模型间的具体分歧或差异（"Model A 认为X，Model B 认为Y，两者差异在于..."）
+ 2. 对每个关键判断说明为什么选A而不选B/C（不允许只说"综合来看"）
+ 3. 如果三模型观点一致，必须挖掘细节差异，或标注"三模型在X点上高度一致，其共同理由是...">
 ### TRADEOFFS
 <权衡分析、已排除方案及理由，用户问"有没有其他方案"时加载>
@@ -87,6 +96,8 @@ curl -fsSL "https://raw.githubusercontent.com/HongjieRen/braintrust/main/skills/
 <未解决的分歧或待确认的假设，用户问"还有什么不确定"时加载>
 ```
+**PERSPECTIVES 的写法原则**：逐字从模型原文中提炼，不要意译或合并。如果 Model A 说"用 Redis 做 session"，就写"用 Redis 做 session"，不要写"推荐缓存方案"。
 ---
 ## 工作流：多轮对话（会话模式）
@@ -166,7 +177,10 @@ Current best: <当前推荐方案一句话>
 !deep     切换到完整记忆（带最近1轮 REASONING + TRADEOFFS，适合复杂设计）
 /done     退出 Consult 会话模式（!stop 同效）
 !deltas   展开本轮三模型核心主张各一句（不显示原文全文）
-!raw      展开本轮三模型完整原始回答
+!raw      旁路展示本轮三模型原文（使用 REVEAL 映射表替换为真实模型名）。
+          约束：① 不重新调用 consult，仅复用主 Claude 已持有的本轮回答；
+                ② 不推进 R{N}，不更新 Session State，不写入 Decisions/Open；
+                ③ 展示完即结束本次响应，下一轮 follow-up 仍按原 Session State 继续。
 ```
 ---
@@ -179,9 +193,13 @@ only        (可选) "codex" | "gemini" | "claude" — 只调用一个
 skip        (可选) ["codex"] | ["gemini"] | ["claude"] — 跳过某个
 timeout_sec (可选) 每个模型超时秒数，默认 90；传 0 = 不限时等待完成
 blind       (可选) 默认 true；传 false 可直接看真实模型名称
+show_raw    (可选) 默认 false；传 true = 直接展示三模型原始回答，跳过 Judge 融合
 cwd         (可选) 子进程工作目录
 ```
+**`show_raw: true` 使用场景**：终端 CLI 或独立一次性查询。
+**注**：主 Claude 在 `/consult` 多轮场景中**不要**主动设置 `show_raw: true`；用户想看原文时用 `!raw` 控制命令（旁路展示、不污染会话）。
 ## timeout 选择策略
 **你（主 Claude）负责决定 timeout_sec：**

package/src/server.js CHANGED Viewed

@@ -95,6 +95,11 @@ const CONSULT_TOOL = {
         description: '匿名化模型名称为 A/B/C，防止位置偏置（默认 true）',
         default: true,
       },
+      show_raw: {
+        type: 'boolean',
+        description: '直接返回三模型原始回答，不经过 Judge 融合（默认 false）。适合想自己阅读原文的场景。',
+        default: false,
+      },
       cwd: {
         type: 'string',
         description: '子进程工作目录（默认：当前进程 cwd）',
@@ -127,6 +132,7 @@ async function handleConsult(args) {
     only,
     timeout_sec = DEFAULT_TIMEOUT_S,
     blind = true,
+    show_raw = false,
     cwd,
   } = args;
@@ -170,7 +176,22 @@ async function handleConsult(args) {
   const successCount = results.filter(r => !r.error).length;
-  // Build labeled pairs
+  // show_raw mode: reveal model names, skip blind labeling, skip REVEAL footer
+  if (show_raw) {
+    const parts = [];
+    for (const r of results) {
+      const timing = r.error
+        ? ` ⚠ ${r.error_type || r.error}`
+        : ` (${(r.duration_ms / 1000).toFixed(1)}s)`;
+      parts.push(`## ${r.provider.toUpperCase()}${timing}\n\n${r.content || '[no output]'}`);
+    }
+    if (successCount < activeProviders.length) {
+      parts.push(`> ⚠ **DEGRADED**: Only ${successCount}/${activeProviders.length} models responded.`);
+    }
+    return { content: [{ type: 'text', text: parts.join('\n\n---\n\n') }] };
+  }
+  // Build labeled pairs (blind mode for Judge workflow)
   const labeled = blind
     ? assignBlindLabels(results)
     : results.map(r => ({ label: r.provider, result: r }));