PyPI - deepresearch-flow - Versions diffs - 0.4.1__py3-none-any.whl → 0.5.1__py3-none-any.whl - Mend

deepresearch-flow 0.4.1py3-none-any.whl → 0.5.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

deepresearch_flow/paper/db.py CHANGED Viewed

@@ -600,6 +600,32 @@ def register_db_commands(db_group: click.Group) -> None:
     )
     @click.option("--cache-dir", "cache_dir", default=None, help="Cache directory for merged inputs")
     @click.option("--no-cache", "no_cache", is_flag=True, help="Disable cache for db serve")
+    @click.option(
+        "--static-base-url",
+        "static_base_url",
+        default=None,
+        help="Static asset base URL (e.g. https://static.example.com)",
+    )
+    @click.option(
+        "--static-mode",
+        "static_mode",
+        type=click.Choice(["auto", "dev", "prod"]),
+        default="auto",
+        show_default=True,
+        help="Static asset mode (dev uses local assets, prod uses static base URL)",
+    )
+    @click.option(
+        "--static-export-dir",
+        "static_export_dir",
+        default=None,
+        help="Optional export directory for hashed static assets",
+    )
+    @click.option(
+        "--pdfjs-cdn-base-url",
+        "pdfjs_cdn_base_url",
+        default=None,
+        help="PDF.js CDN base URL (defaults to jsDelivr)",
+    )
     @click.option("--host", default="127.0.0.1", show_default=True, help="Bind host")
     @click.option("--port", default=8000, type=int, show_default=True, help="Bind port")
     @click.option(
@@ -617,6 +643,10 @@ def register_db_commands(db_group: click.Group) -> None:
         pdf_roots: tuple[str, ...],
         cache_dir: str | None,
         no_cache: bool,
+        static_base_url: str | None,
+        static_mode: str,
+        static_export_dir: str | None,
+        pdfjs_cdn_base_url: str | None,
         host: str,
         port: int,
         fallback_language: str,
@@ -635,6 +665,10 @@ def register_db_commands(db_group: click.Group) -> None:
                 pdf_roots=[Path(root) for root in pdf_roots],
                 cache_dir=Path(cache_dir) if cache_dir else None,
                 use_cache=not no_cache,
+                static_base_url=static_base_url,
+                static_mode=static_mode,
+                static_export_dir=Path(static_export_dir) if static_export_dir else None,
+                pdfjs_cdn_base_url=pdfjs_cdn_base_url,
             )
         except Exception as exc:
             raise click.ClickException(str(exc)) from exc

deepresearch_flow/paper/db_ops.py CHANGED Viewed

@@ -1193,6 +1193,7 @@ def _merge_paper_inputs(inputs: list[dict[str, Any]]) -> list[dict[str, Any]]:
     merged: list[dict[str, Any]] = []
     threshold = 0.95
     prefix_len = 5
+    source_hash_index: dict[str, int] = {}
     bibtex_exact: dict[str, set[int]] = {}
     bibtex_prefix: dict[str, set[int]] = {}
     paper_exact: dict[str, set[int]] = {}
@@ -1226,16 +1227,22 @@ def _merge_paper_inputs(inputs: list[dict[str, Any]]) -> list[dict[str, Any]]:
         for paper in papers:
             if not isinstance(paper, dict):
                 raise ValueError("Input papers must be objects")
+            source_hash = paper.get("source_hash")
+            source_hash_key = str(source_hash) if source_hash else None
             bib_title = _extract_bibtex_title(paper)
             paper_title = _extract_paper_title(paper)
             match = None
             match_idx = None
-            for idx in candidate_ids(bib_title, paper_title):
-                candidate = merged[idx]
-                if _titles_match(candidate, paper, threshold=threshold):
-                    match = candidate
-                    match_idx = idx
-                    break
+            if source_hash_key and source_hash_key in source_hash_index:
+                match_idx = source_hash_index[source_hash_key]
+                match = merged[match_idx]
+            else:
+                for idx in candidate_ids(bib_title, paper_title):
+                    candidate = merged[idx]
+                    if _titles_match(candidate, paper, threshold=threshold):
+                        match = candidate
+                        match_idx = idx
+                        break
             if match is None:
                 group = {
                     "templates": {template_tag: paper},
@@ -1244,6 +1251,8 @@ def _merge_paper_inputs(inputs: list[dict[str, Any]]) -> list[dict[str, Any]]:
                 _add_merge_titles(group, paper)
                 merged.append(group)
                 group_idx = len(merged) - 1
+                if source_hash_key:
+                    source_hash_index[source_hash_key] = group_idx
                 if bib_title:
                     add_index(bib_title, bibtex_exact, bibtex_prefix, group_idx)
                 if paper_title:
@@ -1256,15 +1265,20 @@ def _merge_paper_inputs(inputs: list[dict[str, Any]]) -> list[dict[str, Any]]:
                     order.append(template_tag)
                 _add_merge_titles(match, paper)
                 if match_idx is not None:
+                    if source_hash_key:
+                        source_hash_index[source_hash_key] = match_idx
                     if bib_title:
                         add_index(bib_title, bibtex_exact, bibtex_prefix, match_idx)
                     if paper_title:
                         add_index(paper_title, paper_exact, paper_prefix, match_idx)
+    preferred_defaults = ("simple", "simple_phi")
     for group in merged:
         templates = group.get("templates") or {}
         order = group.get("template_order") or list(templates.keys())
-        default_tag = "simple" if "simple" in order else (order[0] if order else None)
+        default_tag = next((tag for tag in preferred_defaults if tag in order), None)
+        if default_tag is None:
+            default_tag = order[0] if order else None
         group["default_template"] = default_tag
         if default_tag and default_tag in templates:
             base = templates[default_tag]

deepresearch_flow/paper/prompt_templates/deep_read_phi_system.j2 ADDED Viewed

@@ -0,0 +1,6 @@
+You are an information extraction assistant.
+Output language: {{ output_language }}.
+Extract structured data from the provided markdown document.
+Return ONLY valid JSON that conforms to the given JSON Schema.
+The field "paper_authors" MUST be an array of strings (each author name as one item).
+If a field is unknown, use an empty string or empty list per schema.

deepresearch_flow/paper/prompt_templates/deep_read_phi_user.j2 ADDED Viewed

@@ -0,0 +1,391 @@
+Template: deep_read_phi
+{% if stage_name %}
+当前阶段：{{ stage_name }}。
+请仅输出 JSON，包含字段：{{ stage_fields | join(", ") }}。
+输出语言：{{ output_language }}。请使用该语言输出（zh 时使用中文，保留必要英文术语）。
+如需引用此前结果，可参考以下已完成模块（JSON）：{{ previous_outputs }}
+{% else %}
+注意：本工具是单次输出。请一次性完成 M1..M6，并填入 JSON 字段 module_m1..module_m6。
+每个模块字段内部使用 Markdown 编排（标题、列表等）。
+禁止第一人称（不出现“我/我们/本人”）。
+关键结论需要注明来自论文的定位（章节/图/表/公式编号）。
+每轮末尾要求输出的三行仍需保留，但不要中途停止输出。
+输出语言：{{ output_language }}。请使用该语言输出（zh 时使用中文，保留必要英文术语）。
+{% endif %}
+---
+# 通用哲学论文阅读器 Prompt（6轮｜Three-Pass融合｜C1~C7融合｜审稿式Checklist｜Exhibit Mining｜Mermaid避坑｜M1产出markmap）
+你是一个用于“精读哲学/伦理学论文”的高级语言模型。目标是把一篇论文变成可复现、可检查、可引用的结构化成果：争点 → 概念 → 论题 → 论证链 → 反对意见 → 回应 → 评价 → 可直接写作输出。
+外层严格 6 轮输出；每轮只输出该轮模块内容。
+========================
+0) 会话配置（用户可填；缺失则用默认）
+========================
+【论文材料】
+- PDF或正文：{已提供/未提供}
+- 是否有页码/小节编号：{有/无}
+- 论文题目/作者/年份/出处（若已知）：
+【用户目标】
+- 目标（多选）：快速理解 / 写综述 / 写书评 / 课堂讨论 / 写 rebuttal / 做研究延伸 / 考试
+- 用户背景：对该领域熟悉度（0-5）；熟悉的传统（功利/康德/德性/契约/建构/实在论/诠释学等）
+【输出偏好】
+- 输出语言：中文（保留必要英文术语）
+- 禁止第一人称：是（默认）
+- 引用定位粒度：至少到小节（例如 Sect. 5.2）；若能给页码则给页码
+- 是否需要联网核验：默认关闭；仅在用户明确要求“核对出版信息/引文/对手观点转述”等时开启
+- MERMAID_MODE：safe（默认）/ full
+  - safe：优先稳定不报错（牺牲花哨）
+  - full：允许边标签/更复杂形状（但更可能报错）
+========================
+1) 总体硬约束（必须遵守）
+========================
+(1) 全程中文；必要英文术语/短引除外。
+(2) 禁止第一人称：不出现“我/我们/本人”。
+(3) 作者-评估分离：所有关键点都必须拆成两块：
+    - 【作者文本】只写作者明确承诺的内容（允许短引，但每段≤25词/句）。
+    - 【分析与评估】才允许补隐含前提、提出反例、比较流派、给批判与建议。
+(4) 证据定位：每条关键定义/关键主张/关键论证节点都必须给定位（小节+页码若可得）。
+    - 若无页码/小节编号：用“段落锚点”定位（摘取该段开头8-12个词作为锚点）并标【锚点定位】。
+    - 若无法定位：标【未定位】并说明原因（材料缺失/无目录/扫描质量等）。
+(5) 不确定性标注：凡是原文未明说、只能合理推断的内容必须标【推测】；无法核验标【证据不足】。
+(6) 每轮末尾必须输出三行：
+    【已完成模块】…
+    【下一轮将输出】…
+    【需要用户提供/确认的输入（如有）】…
+(7) 每轮必须至少输出 1 张图：
+    - M1 必须输出 1 个 markmap（论文大纲脑图），且建议再输出 1 个 Mermaid（结构或证据流）。
+    - M2~M6 必须输出 Mermaid（按 MERMAID_MODE 规则）。
+========================
+2) Mermaid 中文易报错避坑规范（强制）
+========================
+默认使用 MERMAID_MODE=safe。除非用户明确要求 full，否则一律按 safe 输出。
+【共同规则（safe与full都必须）】
+- 节点 ID 必须只用 ASCII：A1, N2, P3, O4, R5…（禁止中文/空格/连字符-）
+- 节点文字放在 [] 中：A1[这里写中文标签]（不要把中文写进ID）
+- 标签里避免以下字符（常见导致解析失败或跨渲染器不兼容）：
+  - 英文双引号 " 、单引号 ' 、反引号 ` 、竖线 | 、花括号 {} 、尖括号 <> 、方括号嵌套 [[]]
+  - 过长的括号对 ()（）以及在标签里出现未配对符号
+- safe 模式下：默认不写“边上的文字标签”，即不使用 A -- 文本 --> B（兼容性最好）
+- 若必须表达关系类型：优先用“节点标签短词”而不是“边标签”
+- 每张 Mermaid 图必须附“图例 + 至少3个节点定位”（定位写在图外的普通文本中）
+【safe 模式模板（推荐）】
+- 只用 flowchart TB/LR/TD
+- 只用 --> 和 -.-> 和 ==> 三种边
+- 不用边标签，不用引号，不用特殊形状
+【full 模式（用户显式要求才用）】
+- 可以用边标签，但边标签建议用英文或简短拼音，避免中文导致渲染器报错
+- 可以用更多形状，但仍禁止把中文塞进节点ID
+========================
+3) “证据载体”抽取：Exhibit Mining（哲学版图表挖掘）
+========================
+由于哲学论文往往没有图表，证据主要在文本里。定义 Exhibit（证据载体）如下：
+- 定义句/工作定义/必要充分条件
+- 核心主张（thesis / sub-thesis）
+- 关键论证步骤（前提、桥接原则、推理跳步）
+- 思想实验/反例/案例判断
+- 对手观点的转述段（尤其是被批评者）
+- 反对意见（objection）与作者回应（reply）
+每个 Exhibit 都必须有：ID、类型、位置定位、原文短引（可选但推荐）、它支撑/攻击的主张节点。
+========================
+4) 六轮模块（每轮只做一轮；但每轮内部很“厚”）
+========================
+------------------------------------------------------------
+M1：对齐目标 + 输入校验 + 论文地图 + Exhibit全量索引 + markmap大纲脑图
+------------------------------------------------------------
+【本轮目的】
+- 对齐：读这篇论文要达成什么（理解/综述/书评/课堂讨论/研究延伸）
+- 校验：材料是否足够支撑“可定位引用”
+- 建图：先把论文结构与证据载体全量索引出来（不评价先索引）
+- 产出：markmap 大纲脑图（强制）
+【必须执行步骤（按顺序）】
+Step 1：从摘要/引言开头与结论段提取：
+  - 争点问题（debate question）一句话
+  - 主论题（thesis）一句话【暂定】
+  - 论文类型初判（规范伦理/元伦理/认识论/方法论/概念工程/历史诠释等）+ 依据定位
+Step 2：输出“材料可复现性检查”：
+  - 是否有页码/小节编号；若无，声明将使用【锚点定位】
+Step 3：全量索引论文结构（章节→子章节→该节任务）：
+  - 只写该节做什么：提出定义/推进论证/处理反驳/比较对手/收束结论
+Step 4：Exhibit 全量索引：
+  - 扫全文列出 E1..En
+  - 每条包含：ID、类型、位置定位、绑定主张（写成可检验句）
+Step 5：输出阅读路线：
+  - 哪些小节最关键（Top 5），哪些可略读（并说明理由）
+【本轮输出结构（强制三层）】
+- 浅层：
+  - 【作者文本】争点与主论题【暂定】（带定位）
+  - 【分析与评估】这篇属于哪类哲学写作、读它的正确姿势（不下结论）
+- 中层：
+  - 论文结构索引表（全量）
+  - Exhibit 全量索引表（全量）
+- 深层：
+  - 阅读陷阱预警（至少3条：概念多义/推理跳步/稻草人风险/关键前提争议等）
+  - 需要用户确认的目标/输出偏好（若配置缺失）
+【必须输出：markmap 论文大纲脑图（强制）】
+```markmap
+# 论文标题（若未知则写“未提供标题”）
+## 争点（Debate Question）
+## 主论题（Thesis，暂定）
+## 结构（按章节/小节）
+### Sect. 1：……
+### Sect. 2：……
+## 关键证据载体（Exhibits）
+### E1（定义/主张/思想实验…）
+### E2 …
+## 读法路线
+### 必读（Top 5小节）
+### 可略读
+## 风险提示
+```
+【建议再输出 1 张 Mermaid（safe）用于结构树（可选但推荐）】
+```mermaid
+flowchart TB
+  A1[引言 争点与主论题] --> A2[核心区 定义与论证]
+  A2 --> A3[反对意见与回应]
+  A3 --> A4[结论 贡献与局限]
+```
+图例 + 至少3个节点定位
+轮末尾三行并停止：
+【已完成模块】M1
+【下一轮将输出】M2 第一遍鸟瞰 + Exhibit客观打分排序
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+M2：第一遍鸟瞰（Three-Pass第1遍）+ C1/C6/C7折叠 + Exhibit打分（H2精神）
+【本轮目的】
+用“5-10分钟风格”回答：这篇在争什么、贡献是什么、清晰度怎样、值不值得深读。
+同时把 Exhibit 做客观重要性打分并排序，确定后续深读焦点。
+【必须产出五件套（哲学版）】
+类别（论文类型）+ 依据定位。
+上下文：在回应哪类批评/争论（只基于文中线索；超出则【推测】）。
+正确性直觉检查：关键前提是否看起来站得住（只初筛）。
+贡献：3-5条（可检验表达，每条定位）。
+清晰度：定义是否清楚、论证是否线性、对手是否被公平呈现。
+【必须回答（融合C1/C6/C7）】
+争点问题句式化。
+忠实摘要（150-200字）+ 5条要点（每条定位）。
+阅读建议：新手/写综述/写书评各应读哪些小节。
+【必须完成 Exhibit 客观打分（H2精神）并排序】
+对每个 Exhibit 按同一规则打分 0-10：
+- 贡献中心度（0-3）
+- 支撑力度（0-3）
+- 写作复用价值（0-2）
+- 信息密度（0-1）
+- 误读风险（-0-1）
+输出：排序清单 + Top 5。
+【必须输出 Mermaid：争点→论题→贡献/风险（safe）】
+```mermaid
+flowchart LR
+  Q1[争点问题] --> T1[主论题]
+  T1 --> K1[贡献1]
+  T1 --> K2[贡献2]
+  T1 -.-> R1[风险1]
+  T1 -.-> R2[风险2]
+```
+图例 + 至少3个节点定位（Q1/T1/K1）。
+轮末尾：
+【已完成模块】M2
+【下一轮将输出】M3 概念与术语工程 + 辩论谱系（相关工作哲学版）
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+M3：概念与术语工程 + 辩论谱系（融合术语表F + 相关工作C2哲学版）
+【本轮目的】
+把概念钉死：术语表、概念依赖、概念滑移风险。
+在“辩论地图”里定位作者：最强对手/最相近路线/正交路线（只基于论文明确提及；缺失标【证据不足】）。
+【必须执行步骤】
+Step 1：抽取 12-25 个关键术语（按重要性排序）。
+Step 2：每个术语输出四件套：
+- 定义（原文转述+定位）
+- 功能（它在论证里连接哪些节点）
+- 混淆项（作者是否区分）
+- 稳定性：稳定/【滑移风险】（给证据定位）
+Step 3：输出“概念依赖图”（哪些概念依赖哪些定义/区分）。
+Step 4：输出“辩论谱系三分法”（哲学版相关工作）：
+- 最强对手观点（steelman；若论文没展开则标【推测】）
+- 最相近路线（方法或目标相近）
+- 正交路线（换框架解决同争点）
+注意：只能基于论文明确提到的人名/学派/文献；超出标【证据不足】。
+【必须输出 Mermaid：概念依赖图（safe）】
+```mermaid
+flowchart LR
+  C1[核心概念1] ==> C3[核心概念3]
+  C2[核心概念2] ==> C3
+  C3 ==> T1[主论题相关]
+  C4[滑移风险概念] -.-> T1
+```
+图例 + 至少3个依赖关系定位。
+轮末尾：
+【已完成模块】M3
+【下一轮将输出】M4 论证重建（Argument Map）+ Top Exhibits 深读（上半）
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+M4：论证重建（Three-Pass第2遍核心）+ Argument Map + Top Exhibits 深读（上半）
+【本轮目的】
+把论文从线性叙述变成“可检查的论证结构”：主结论→子结论→前提→桥接原则→推理类型。
+深读 Top Exhibits 的前一半（建议2-3个）。
+【必须执行步骤】
+Step 1：锁定主结论 MC（一句话+定位）。
+Step 2：抽取 2-5 个关键子结论 SC（每条定位）。
+Step 3：为每个 SC 抽取前提与桥接原则：
+- 定义性前提 / 描述性前提 / 规范性前提 / 方法论前提 / 桥接原则
+- 标注推理类型：演绎/类比/溯因/反证/概念分析/定义推出
+Step 4：输出“论证台账（Argument Ledger）”：每个节点一行：
+ID、内容、类型、证据类型（直觉/思想实验/概念区分/文献）、定位、脆弱点提示。
+Step 5：画 Mermaid 论证图（支持边/反驳边；若论文未显式反驳则标“未显式”）。
+Step 6：Top Exhibits 深读（上半，2-3个），每个 Exhibit 统一结构：
+- 绑定的 claim/节点ID
+- 原文短引（可选）+ 转述（必须）+ 定位
+- 它能直接支持的结论（禁止过度解读）
+- 隐含前提/误读风险
+- 写作复用：给一条“可直接引用的转述句”
+【必须输出 Mermaid：论证图（safe）】
+```mermaid
+flowchart TD
+  MC[主结论] <-- SC1[子结论1]
+  MC <-- SC2[子结论2]
+  SC1 <-- P1[前提1]
+  SC1 <-- B1[桥接原则]
+  O1[论文内反对] -.-> SC1
+  R1[作者回应] --> O1
+```
+图例 + 至少3个节点定位（MC/SC1/任一Exhibit）。
+轮末尾：
+【已完成模块】M4
+【下一轮将输出】M5 深度审视（Three-Pass第3遍）+ objection mining + Top Exhibits 深读（下半）
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+M5：深度审视（Three-Pass第3遍）+ objection mining + 失败模式/反例压力测试 + Top Exhibits 深读（下半）
+【本轮目的】
+像审稿一样做压力测试：有效性、前提负担、概念偷换、反例、对手公平性、失败模式与补救。
+把 objections 与 replies 系统化，并加入外加反对。
+深读剩余 Top Exhibits（下半）。
+【必须包含五件套（哲学版可复现重建）】
+- 最小论证骨架：P1..Pn ⟹ C（每条定位、类型标注）
+- 假设清单：显式 + 隐含（每条说明：不接受会导致哪个节点塌）
+- 失败模式（至少3类）：
+  1) 概念滑移导致论证不再同一对象
+  2) 桥接原则争议过大（从案例/直觉到原则跃迁）
+  3) 对手被弱化或关键反例未覆盖
+- 审稿式强弱点评估：强点/弱点/可补救（绑定节点或 Exhibit）
+- 下一步研究：3个可执行 follow-up（做什么/为什么/风险/需要补哪类文献或论证）
+【必须完成 objection mining（系统版）】
+- 抽取论文显式 objections：O1..Ok（每条定位）
+- 对应作者回应：R1..Rk（每条定位）
+- 外加反对至少3条（标【外加反对】并指向论证节点）
+- 每条给三评分：严重性(1-5)/回应充分性(1-5)/回应代价（文字）
+【必须做至少3类压力测试】
+- 【外加反例/思想实验】对关键定义或桥接原则施压
+- 【概念偷换测试】用“含义A/含义B”重读关键术语，看论证是否变形
+- 【钢人化对手】把对手观点写成更强版本，检查作者回应是否仍成立
+【必须输出 Mermaid：反对-回应树（safe）】
+```mermaid
+flowchart TB
+  X1[被攻击节点] -.-> O2[反对意见]
+  O2 --> R2[作者回应]
+  R2 -.-> Cx[回应代价]
+  OX[外加反对] -.-> X1
+```
+图例 + 至少3个节点定位（O2/R2/被攻击节点）。
+轮末尾：
+【已完成模块】M5
+【下一轮将输出】M6 写作级产出包（摘要/要点/讨论题/研究延伸/可选核验）
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+M6：写作级产出包（可直接用于综述/书评/讨论课/研究笔记）
+【本轮目的】
+把前5轮成果变成可直接粘贴使用的写作材料，同时提供后续研究与可选核验入口。
+【必须产出固定清单】
+- 忠实摘要（200-350字）：不夹带评价；带定位线索
+- 关键要点 8-12 条：每条定位
+- 最小论证骨架（P1..Pn ⟹ C）：每条定位
+- 评价段（150-250字）：强点/弱点/最大悬念（绑定节点/Exhibit）
+- 讨论课问题 6-10 个（概念澄清→有效性→反例→传统对比→方法论含义）
+- 研究延伸 3 个（做什么/为什么/风险/需要补哪类材料）
+- 阅读建议：不同目的（快速/综述/书评/研究）该怎么复读哪些小节
+【可选：联网核验入口（默认不执行）】
+若用户要求核验，则输出：
+- 核验清单（出版信息/关键引文/对手观点原文一致性）
+- 关键词与检索式建议
+- 声明“需要开启联网核验模式”后再执行
+无法核验必须写【证据不足】。
+【必须输出 Mermaid：一页总结图（safe）】
+```mermaid
+flowchart TB
+  Q1[争点] --> T1[主论题]
+  T1 --> C1[核心概念]
+  T1 --> A1[论证骨架]
+  A1 -.-> O1[关键反对]
+  O1 --> R1[回应]
+  T1 --> U1[开放问题]
+```
+图例 + 至少3个节点定位（T1/A1/任一Exhibit）。
+轮末尾：
+【已完成模块】M6
+【下一轮将输出】（无；若用户要求“联网核验”，进入附加模式）
+【需要用户提供/确认的输入（如有）】（无则写“无”）
+========================
+5) 开始执行
+请在 M1 中完成：对齐目标 + 输入校验 + 结构索引 + Exhibit全量索引 + markmap大纲脑图。
+完成后在 M2..M6 依次完成后续模块。
+Document content:
+{{ content }}
+JSON Schema:
+{{ schema }}

deepresearch_flow/paper/prompt_templates/eight_questions_phi_system.j2 ADDED Viewed

@@ -0,0 +1,6 @@
+You are an information extraction assistant.
+Output language: {{ output_language }}.
+Extract structured data from the provided markdown document.
+Return ONLY valid JSON that conforms to the given JSON Schema.
+The field "paper_authors" MUST be an array of strings (each author name as one item).
+If a field is unknown, use an empty string or empty list per schema.

deepresearch_flow/paper/prompt_templates/eight_questions_phi_user.j2 ADDED Viewed

@@ -0,0 +1,133 @@
+Template: eight_questions_phi
+{% if stage_name %}
+Current stage: {{ stage_name }}.
+Return JSON with keys: {{ stage_fields | join(", ") }}.
+Output language: {{ output_language }}. Use that language in all answers (if zh, use Chinese).
+Previously completed outputs (JSON): {{ previous_outputs }}
+{% else %}
+Answer each question in the corresponding JSON field question1 through question8.
+Output language: {{ output_language }}. Use that language in all answers (if zh, use Chinese).
+{% endif %}
+# 哲学/伦理学论文精读 Prompt（8问题版｜辩论-论证对齐｜含文字流程图｜可复现定位）
+你将得到一篇哲学/伦理学论文（PDF全文/摘录/笔记均可）。任务是用下面 8 个问题，系统、可复现地精读论文，并输出结构化答案。
+写作强调“争点→概念→论证→反对→回应→评价→意义”，而不是实验复现。
+========================
+输入（用户提供）
+========================
+【论文全文/摘录/笔记】：
+<粘贴在这里>
+【可选：用户目标与背景】：
+- 目标：快速理解/写综述/写书评/课堂讨论/研究延伸/写 rebuttal
+- 熟悉度：0-5
+- 偏好传统：功利/康德/德性/契约/建构/实在论/诠释学等
+- 论文类型（若用户不填，由你在Q1中初判）：规范伦理/元伦理/认识论/方法论/概念工程/历史诠释
+========================
+硬约束（必须遵守）
+========================
+1) 输出语言：中文（保留必要英文术语）。
+2) 禁止第一人称：不出现“我/我们/本人”。
+3) 作者-评估分离：每个问题都必须分成两块：
+   - 【作者文本】只写论文明确承诺的内容（必要时短引≤25词/句）。
+   - 【分析与评估】才允许补隐含前提、提出反例、比较传统、评价强弱。
+4) 定位要求：每个问题至少给出 2 处“最小定位标签”：
+   - 优先：{Sect.X.Y} 或 {p.Z, Sect.X.Y}
+   - 若无页码/小节：用 {锚点:段首8-12字} 作为定位
+   - 若无法定位：标【未定位】并说明原因（摘录不全/缺页码等）
+5) 防幻觉：超出原文必须标【推测】；原文未给证据/范围必须写“论文未给出”或【证据不足】。
+6) 输出顺序严格按 Q1→Q8。除 Q8 的“5 bullets”外，不要堆长列表；保持信息密度。
+7) 输出语言以 {{ output_language }} 为准（zh 时使用中文）。
+========================
+Mermaid/流程图要求（避免中文报错）
+========================
+- 本任务“必须包含文字流程图（ASCII）”，不强制 Mermaid。
+- 如果用户明确要求 Mermaid，再额外给一张 Mermaid-safe 图，并遵守：
+  (a) 节点ID只用ASCII：A1,B2,C3… 禁止中文/空格/连字符-
+  (b) 中文只放在节点标签里：A1[中文标签]
+  (c) 标签里避免：引号 " ' ` 、竖线 | 、花括号 {} 、尖括号 <> 、嵌套方括号 [[]]
+  (d) safe模式只用 -->  -.->  ==> ，不写边标签文本
+========================
+8 个问题（哲学/伦理学版）
+========================
+Q1) 这篇论文试图解决什么问题？
+- 要求：把“争点”写成一个可争论的问题句（debate question），并给出作者的主论题（thesis）一句话版本。
+- 同时给出论文类型初判（规范伦理/元伦理/方法论/概念工程/历史诠释等）及依据。
+Q2) 有哪些相关研究/立场？
+- 要求：按三类组织“辩论谱系”，而不是SOTA：
+  (a) 最强对手/基线立场（strongest rival）：能与作者正面冲突的最好版本（若论文未充分呈现，标【推测】）
+  (b) 最相近路线（closest approach）：目标相近或方法相近的论证/定义/框架
+  (c) 正交方向（orthogonal directions）：从不同框架处理同争点（例如换元伦理立场/换正当化模型/换解释路径）
+- 每类至少给 1-2 个明确指代（作者/文献/学派）与定位。
+Q3) 作者如何解决这个问题？（必须含文字流程图）
+- 要求：用 3–6 句复述“论证主链”，并显式标出至少一个“桥接环节”（从概念区分→原则/规则→结论，或从案例直觉→原则等）。
+- 必须提供一个“文字流程图（ASCII）”，示例格式：
+  [争点] -> [主论题] -> [关键概念界定] -> [论证路线A] -> [关键反对] -> [回应] -> [结论/含义]
+- 若用户要求 Mermaid，再额外输出 Mermaid-safe 版本（遵守避坑规则）。
+Q4) 论文使用了哪些“证据载体/材料/设定”？为什么这些材料能验证/支撑主张？
+（哲学版替代“数据集与实现设置”）
+- 证据载体可包括：定义句/必要充分条件、思想实验、反例、案例直觉、经验事实、文本引文、方法规则（如反思均衡的规则集）、对手观点转述段等。
+- 要求：列出 3–6 个最关键的“Exhibits”（E1..En），并说明每个 Exhibit 支撑的主张节点是什么、为何相关。
+Q5) 论文的“评估标准/论证结果”是什么？哪些结果对应作者的哪些创新点？
+（哲学版替代“指标与结果”）
+- 要求：先列“评估标准”（相当于 metrics），常见如：
+  - 论证有效性（validity）：形式上是否推出
+  - 前提可接受性/可信度（plausibility）
+  - 概念清晰度与避免滑移
+  - 解释力/覆盖范围（explanatory scope）
+  - 简约性（parsimony）
+  - 规范适当性（normative adequacy）
+  - 与既有信念/判断的一致性或改进（反思均衡意义上的coherence）
+- 再总结作者声称达成的“结果”（例如：给出工作定义、化解某类反例、驳倒某批评、澄清争点等）。
+- 关键要求：说明“每条结果主要反映作者的哪项创新/动作”（定义创新、论证创新、反驳创新、方法规则创新等）。
+Q6) 还有什么可以进一步探索？
+- 必须按四类拆分：
+  (a) 理论/论证：哪些前提可削弱或替换？还能不能更强？
+  (b) 工程/形式化：能否形式化、做决策程序、或做更可操作的判准？
+  (c) 数据/经验：需要什么经验研究/案例材料来检验关键前提或应用后果？（若论文不涉及经验，写“论文未给出”，再给【推测】建议）
+  (d) 评测/压力测试：还缺哪些反例、跨传统检验、或对手钢人化版本？
+Q7) 这套观点/方法在现实世界会如何工作？
+- 要求：把论文主张落到现实场景（政策/法律/公共理性/AI伦理/医学伦理/学术方法等），并写出约束：
+  - 信息约束（我们是否知道足够事实）
+  - 制度约束（现实制度是否允许按该原则行事）
+  - 计算/时间/协商成本（公共讨论与决策的成本）
+  - 鲁棒性（在分歧、偏见、噪声事实下是否仍可靠）
+- 若论文没有谈现实应用，写“论文未给出”，再给【推测】两条可能应用路径。
+Q8) 总结主要内容（one paragraph + 5 bullets + 一个核心压缩表达）
+- one paragraph：200–350字忠实摘要（带定位）
+- 5 bullets：5条要点（每条带定位）
+- 核心压缩表达（从论文中抽取最关键的一条，用纯ASCII表示，避免引号与特殊符号）四选一：
+  - 核心判准：X iff (A and B and C)
+  - 或 核心定义：X := (R1,R2,R3)
+  - 或 核心原则：If P then Q
+  - 或 核心论证骨架：P1 + P2 + ... + Pn => C
+  选择规则：若论文给出必要/充分条件或工作定义，优先“判准/定义”；若是规范伦理，优先“原则”；否则用“论证骨架”。
+========================
+输出模板（每个问题必须按此写）
+========================
+Qk) <问题标题>
+【作者文本】……{定位1}{定位2}
+【分析与评估】……（若有推断必须标【推测】）
+现在开始依次回答 Q1–Q8。
+Document content:
+{{ content }}
+JSON Schema:
+{{ schema }}

deepresearch_flow/paper/prompt_templates/simple_phi_system.j2 ADDED Viewed

@@ -0,0 +1,6 @@
+You are an information extraction assistant.
+Output language: {{ output_language }}.
+Extract structured data from the provided markdown document.
+Return ONLY valid JSON that conforms to the given JSON Schema.
+The field "paper_authors" MUST be an array of strings (each author name as one item).
+If a field is unknown, use an empty string or empty list per schema.

deepresearch-flow 0.4.1__py3-none-any.whl → 0.5.1__py3-none-any.whl

deepresearch-flow 0.4.1py3-none-any.whl → 0.5.1py3-none-any.whl