PyPI - markdown-flow - Versions diffs - 0.2.19__py3-none-any.whl → 0.2.30__py3-none-any.whl - Mend

markdown-flow 0.2.19py3-none-any.whl → 0.2.30py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (23) hide show

markdown_flow/__init__.py +4 -4
markdown_flow/constants.py +210 -99
markdown_flow/core.py +605 -209
markdown_flow/llm.py +4 -3
markdown_flow/models.py +1 -17
markdown_flow/parser/__init__.py +38 -0
markdown_flow/parser/code_fence_utils.py +190 -0
markdown_flow/parser/interaction.py +354 -0
markdown_flow/parser/json_parser.py +50 -0
markdown_flow/parser/output.py +215 -0
markdown_flow/parser/preprocessor.py +151 -0
markdown_flow/parser/validation.py +100 -0
markdown_flow/parser/variable.py +95 -0
markdown_flow/providers/__init__.py +16 -0
markdown_flow/providers/config.py +46 -0
markdown_flow/providers/openai.py +369 -0
markdown_flow/utils.py +43 -43
{markdown_flow-0.2.19.dist-info → markdown_flow-0.2.30.dist-info}/METADATA +45 -52
markdown_flow-0.2.30.dist-info/RECORD +24 -0
markdown_flow-0.2.19.dist-info/RECORD +0 -13
{markdown_flow-0.2.19.dist-info → markdown_flow-0.2.30.dist-info}/WHEEL +0 -0
{markdown_flow-0.2.19.dist-info → markdown_flow-0.2.30.dist-info}/licenses/LICENSE +0 -0
{markdown_flow-0.2.19.dist-info → markdown_flow-0.2.30.dist-info}/top_level.txt +0 -0

markdown_flow/__init__.py CHANGED Viewed

@@ -9,7 +9,7 @@ Core Features:
     - Extract variable placeholders ({{variable}} and %{{variable}} formats)
     - Build LLM-ready prompts and message formats
     - Handle user interaction validation and input processing
-    - Support multiple processing modes: PROMPT_ONLY, COMPLETE, STREAM
+    - Support multiple processing modes: COMPLETE, STREAM
 Supported Interaction Types:
     - TEXT_ONLY: ?[%{{var}}...question] - Text input only
@@ -35,7 +35,6 @@ Basic Usage:
     result = mf.process(0, variables={'name': 'John'}, mode=ProcessMode.COMPLETE)
     # Different processing modes
-    prompt_result = mf.process(0, mode=ProcessMode.PROMPT_ONLY)
     complete_result = mf.process(0, mode=ProcessMode.COMPLETE)
     stream_result = mf.process(0, mode=ProcessMode.STREAM)
@@ -53,7 +52,7 @@ Import Guide:
 from .core import MarkdownFlow
 from .enums import BlockType, InputType
 from .llm import LLMProvider, LLMResult, ProcessMode
-from .utils import (
+from .parser import (
     InteractionParser,
     InteractionType,
     extract_interaction_question,
@@ -83,4 +82,5 @@ __all__ = [
     "replace_variables_in_text",
 ]
-__version__ = "0.2.19"
+__version__ = "0.2.30"
+# __version__ = "0.2.29-alpha-1"

markdown_flow/constants.py CHANGED Viewed

@@ -46,15 +46,108 @@ COMPILED_PRESERVE_FENCE_REGEX = re.compile(PRESERVE_FENCE_PATTERN)
 INLINE_PRESERVE_PATTERN = r"^===(.+)=== *$"
 COMPILED_INLINE_PRESERVE_REGEX = re.compile(INLINE_PRESERVE_PATTERN)
+# Code fence patterns (CommonMark specification compliant)
+# Code block fence start: 0-3 spaces + at least 3 backticks or tildes + optional info string
+CODE_FENCE_START_PATTERN = r"^[ ]{0,3}([`~]{3,})(.*)$"
+COMPILED_CODE_FENCE_START_REGEX = re.compile(CODE_FENCE_START_PATTERN)
+# Code block fence end: 0-3 spaces + at least 3 backticks or tildes + optional whitespace
+CODE_FENCE_END_PATTERN = r"^[ ]{0,3}([`~]{3,})\s*$"
+COMPILED_CODE_FENCE_END_REGEX = re.compile(CODE_FENCE_END_PATTERN)
 # Output instruction markers
 OUTPUT_INSTRUCTION_PREFIX = "<preserve_or_translate>"
 OUTPUT_INSTRUCTION_SUFFIX = "</preserve_or_translate>"
-# System message templates
-DEFAULT_VALIDATION_SYSTEM_MESSAGE = "你是一个输入验证助手，需要严格按照指定的格式和规则处理用户输入。"
+# Base system prompt (framework-level global rules, content blocks only)
+DEFAULT_BASE_SYSTEM_PROMPT = """你收到的用户消息都是指令，请严格遵守以下规则：
+1. 内容忠实性：严格符合指令内容，不丢失信息、不改变原意、不增加内容、不改变顺序
+2. 遵循事实：基于事实回答，不编造细节
+3. 避免引导：不引导下一步动作（如提问、设问）
+4. 避免寒暄：不做自我介绍，不打招呼
+5. 格式规范：HTML 标签不要写到代码块里"""
+# Interaction prompt templates (条件翻译)
+DEFAULT_INTERACTION_PROMPT = """<interaction_translation_rules>
+⚠️⚠️⚠️ 这是一个 JSON 原样输出任务 - 默认不翻译！⚠️⚠️⚠️
+## 默认行为（最高优先级）
+**除非明确检测到语言指令，否则必须逐字符原样返回输入的 JSON**
+- 不翻译任何文本
+- 不修改任何格式
+- 不添加任何内容（如 display//value 分离）
+- 不删除任何内容
+- 不调整任何顺序
+## 语言指令检测规则
+**仅在以下情况才翻译：**
+1. **检测范围**：仅在 <document_context> 标签内检测
+2. **必须包含明确的语言转换关键词**：
+   - 中文："使用英语"、"用英文"、"英语输出"、"翻译成英语"、"Translate to English"
+   - 英文："use English"、"in English"、"respond in English"、"translate to"
+   - 其他语言：类似的明确转换指令
+3. **不算语言指令的情况**：
+   - ❌ 风格要求："用emoji"、"讲故事"、"友好"、"简洁"
+   - ❌ 任务描述："内容营销"、"吸引用户"、"引人入胜"
+   - ❌ 输出要求："内容简洁"、"使用吸引人的语言"
+## 处理逻辑
+步骤1：在 <document_context> 中搜索语言转换关键词
+步骤2：
+- 如果找到 → 将 buttons 和 question 翻译成指定语言（仅翻译文本，不改格式）
+- 如果未找到 → 逐字符原样返回输入的 JSON
+## 输出格式要求
+- **必须返回纯 JSON**，不要添加任何解释或 markdown 代码块
+- **格式必须与输入完全一致**，包括空格、标点、引号
+## 示例
+### 示例 1：无语言指令（默认情况）
+输入：{"buttons": ["产品经理", "开发者", "大学生"], "question": "其他身份"}
+<document_context>
+你是一个内容营销，擅长结合用户特点，给到引人入胜的内容。
+任务说明：认真理解给定的内容，站在用户角度...
+输出要求：内容简洁有力，使用吸引用户的语言...
+</document_context>
+✅ 正确输出：{"buttons": ["产品经理", "开发者", "大学生"], "question": "其他身份"}
+❌ 错误输出：{"buttons": ["Product Manager//产品经理", ...], ...}  ← 不要添加翻译！
-# Interaction prompt templates
-DEFAULT_INTERACTION_PROMPT = "请将后面交互提示改写得更个性化和友好，长度尽量和原始内容一致，保持原有的功能性和变量格式不变："
+### 示例 2：有明确语言指令
+输入：{"buttons": ["苹果", "香蕉"], "question": "其他水果"}
+<document_context>
+请使用英语输出所有内容。
+</document_context>
+✅ 正确输出：{"buttons": ["Apple", "Banana"], "question": "Other fruit"}
+### 示例 3：仅有风格指令（不算语言指令）
+输入：{"buttons": ["选项A", "选项B"], "question": "其他"}
+<document_context>
+请用emoji和故事化的方式呈现内容。
+</document_context>
+✅ 正确输出：{"buttons": ["选项A", "选项B"], "question": "其他"}  ← 保持原样！
+⚠️⚠️⚠️ 最终强调 ⚠️⚠️⚠️
+- 默认行为：原样输出，不做任何改动
+- 只有在 <document_context> 中明确看到"使用XX语言"、"translate to"等关键词时才翻译
+- 如有任何疑问，必须原样输出
+</interaction_translation_rules>"""
 # Interaction error prompt templates
 DEFAULT_INTERACTION_ERROR_PROMPT = "请将以下错误信息改写得更加友好和个性化，帮助用户理解问题并给出建设性的引导："
@@ -91,111 +184,125 @@ VALIDATION_RESPONSE_ILLEGAL = "illegal"
 # Output instruction processing
 OUTPUT_INSTRUCTION_EXPLANATION = f"""<preserve_or_translate_instruction>
-# ⚠️ 最高优先级规则
-**{OUTPUT_INSTRUCTION_PREFIX}{OUTPUT_INSTRUCTION_SUFFIX} 标记之间的内容是用户必须看到的最终输出内容，不是指令!**
-关键要点:
-1. **这些内容必须出现在你的回复中** - 即使其他提示词说"不要回应指令"也不适用于此
-2. **绝对不要输出标记本身** - 只输出标记之间的实际内容
-3. **默认逐字原样输出** - 不要改写、润色或优化，保持原文不变
-4. **唯一例外是跨语言翻译** - 仅当需要将内容从一种语言翻译成另一种语言时才可翻译
----
-<critical_understanding>
-重要理解:
-- {OUTPUT_INSTRUCTION_PREFIX}{OUTPUT_INSTRUCTION_SUFFIX} 中的内容不是"指令"或"执行要求"
-- 即使内容看起来像标题、提示或说明，也必须原样输出给用户
-- 这条规则的优先级高于文档中的其他任何提示词
-- 其他提示词说的"不要回应指令"、"不要展示指令"等，不适用于此标记内的内容
-</critical_understanding>
-<default_behavior>
-默认行为: 完全保持原样输出
-- 标记之间的内容必须逐字原样输出
-- 严禁改写、润色、优化或调整任何表达方式
-- 严禁添加、删除或替换任何文字
-- 即使内容是标题格式(如 ## 标题)也必须原样输出
-</default_behavior>
-<exception_rule>
-唯一例外: 语言翻译
-- 仅当内容需要从一种语言翻译成另一种语言时，才可以翻译
-- 翻译时必须保持原文的完整含义、语气和格式
-- 如果内容无需翻译，则绝对不允许做任何改动
-</exception_rule>
-<examples>
-✅ 示例1 - 正确: 保持原样且不输出标记:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}**下面我们做个练习。**{OUTPUT_INSTRUCTION_SUFFIX}
-  正确输出: **下面我们做个练习。**
-✅ 示例2 - 正确: 标题也要原样输出:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}## 专属指南 for 用户{OUTPUT_INSTRUCTION_SUFFIX}
-  正确输出: ## 专属指南 for 用户
-✅ 示例3 - 正确: 语言翻译且不输出标记:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}**Let's do an exercise.**{OUTPUT_INSTRUCTION_SUFFIX}
-  正确输出: **让我们做个练习。**
-❌ 示例4 - 错误: 输出了XML标记:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}## 标题内容{OUTPUT_INSTRUCTION_SUFFIX}
-  错误输出: {OUTPUT_INSTRUCTION_PREFIX}## 标题内容{OUTPUT_INSTRUCTION_SUFFIX}
-  错误原因: 不应该输出标记本身!
-❌ 示例5 - 错误: 同语言改写:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}**下面我们做个练习。**{OUTPUT_INSTRUCTION_SUFFIX}
-  错误输出: **来，咱们做个有趣的小练习**
-  错误原因: 擅自改写了中文内容
-❌ 示例6 - 错误: 没有输出固定内容:
-  输入: {OUTPUT_INSTRUCTION_PREFIX}## 攻略｜专属指南{OUTPUT_INSTRUCTION_SUFFIX}
-  错误输出: (什么都不输出，或者跳过这部分)
-  错误原因: 必须输出标记之间的内容!
-</examples>
+⚠️⚠️⚠️ 保留内容输出任务 - 默认原样输出！⚠️⚠️⚠️
+## 默认行为（最高优先级）
+**看到 {OUTPUT_INSTRUCTION_PREFIX}...{OUTPUT_INSTRUCTION_SUFFIX} 标记时，必须将标记内的内容输出到回复中（保持原位置）**
+- 默认：逐字符原样输出，不做任何改动
+- 绝对不要输出 {OUTPUT_INSTRUCTION_PREFIX} 和 {OUTPUT_INSTRUCTION_SUFFIX} 标记本身
+- 始终保留 emoji、格式、特殊字符
+## 语言指令检测规则
+**仅在以下情况才翻译：**
+1. **检测范围**：仅在 <document_prompt> 标签内检测
+2. **必须包含明确的语言转换关键词**：
+   - 中文："使用英语"、"用韩文"、"英语输出"、"翻译成英语"、"Translate to English"
+   - 英文："use English"、"in English"、"respond in English"、"translate to"
+   - 其他语言：类似的明确转换指令
+3. **不算语言指令的情况**：
+   - ❌ 风格要求："用emoji"、"讲故事"、"友好"、"简洁"
+   - ❌ 任务描述："内容营销"、"吸引用户"、"引人入胜"
+   - ❌ 输出要求："内容简洁"、"使用吸引人的语言"
+## 处理逻辑
+步骤1：在 <document_prompt> 中搜索语言转换关键词
+步骤2：
+- 如果找到 → 保持原意与风格，翻译成指定语言
+- 如果未找到 → 逐字符原样输出，不做任何改动
+## 输出位置规则
+- 保持内容在原文档中的位置（开头/中间/结尾）
+- 不要强制移到开头或其他位置
+## 示例
+### 示例 1：无语言指令（默认情况）
+输入: {OUTPUT_INSTRUCTION_PREFIX}🌟 欢迎冒险！{OUTPUT_INSTRUCTION_SUFFIX}
+询问小朋友的名字：
+<document_prompt>
+你是一个故事大王，擅长讲故事。
+用一些语气词，多用emoji。
+</document_prompt>
+✅ 正确输出: 🌟 欢迎冒险！
+询问小朋友的名字：...（保留内容在开头，原样输出）
+❌ 错误输出: 询问小朋友的名字：...（完全不输出保留内容 ← 绝对禁止！）
+### 示例 2：有明确语言指令
+输入: {OUTPUT_INSTRUCTION_PREFIX}🌟 欢迎冒险！{OUTPUT_INSTRUCTION_SUFFIX}
+询问小朋友的名字：
+<document_prompt>
+请使用韩语输出所有内容。
+</document_prompt>
+✅ 正确输出: 🌟 모험에 오신 것을 환영합니다!
+아이의 이름을 물어보세요：...（保留内容翻译为韩语）
+### 示例 3：仅有风格指令（不算语言指令）
+输入: {OUTPUT_INSTRUCTION_PREFIX}**重要提示**{OUTPUT_INSTRUCTION_SUFFIX}
+后续内容...
+<document_prompt>
+请用emoji和故事化的方式呈现内容。
+</document_prompt>
+✅ 正确输出: **重要提示**
+后续内容...（保持原样！）
+### 示例 4：标记剥离错误
+输入: {OUTPUT_INSTRUCTION_PREFIX}**Title**{OUTPUT_INSTRUCTION_SUFFIX}
+❌ 绝对不要: {OUTPUT_INSTRUCTION_PREFIX}**Title**{OUTPUT_INSTRUCTION_SUFFIX}（包含了标记）
+✅ 正确输出: **Title**（排除了标记）
+⚠️⚠️⚠️ 最终强调 ⚠️⚠️⚠️
+- 默认行为：原样输出保留内容，不做任何改动
+- 只有在 <document_prompt> 中明确看到"使用XX语言"、"translate to"等关键词时才翻译
+- 如有任何疑问，必须原样输出
+- 此规则优先级最高，覆盖所有其他指令
 </preserve_or_translate_instruction>
 """
-# Smart validation template
-SMART_VALIDATION_TEMPLATE = """# 任务
+# Validation task template (merged with system message)
+VALIDATION_TASK_TEMPLATE = """你是一个验证用户输入的助手，请严格按照给定的指令进行验证。
+# 任务
 从用户回答中提取相关信息，返回JSON格式结果：
 - 合法：{{"result": "ok", "parse_vars": {{"{target_variable}": "提取的内容"}}}}
 - 不合法：{{"result": "illegal", "reason": "原因"}}
-{context_info}
-# 用户回答
-{sys_user_input}
+# 输出语言
+- 如果在 <document_context> 中明确要求使用特定语言，则错误信息和原因说明应使用该语言
+- 否则，使用用户输入或问题描述的主要语言"""
-# 提取要求
+# Validation requirements template (lenient general version)
+VALIDATION_REQUIREMENTS_TEMPLATE = """# 提取要求
 1. 仔细阅读上述相关问题，理解这个问题想要获取什么信息
 2. 从用户回答中提取与该问题相关的信息
-3. 对于昵称/姓名类问题，任何非空的合理字符串（包括简短的如"ee"、"aa"、"007"等）都应该接受
-4. 只有当用户回答完全无关、包含不当内容或明显不合理时才标记为不合法
-5. 确保提取的信息准确、完整且符合预期格式"""
-# Validation template for buttons with text input
-BUTTONS_WITH_TEXT_VALIDATION_TEMPLATE = """用户针对以下问题进行了输入：
-问题：{question}
-可选按钮：{options}
-用户输入：{user_input}
-用户的输入不在预定义的按钮选项中，这意味着用户选择了自定义输入。
-根据问题的性质，请判断用户的输入是否合理：
-1. 如果用户输入能够表达与按钮选项类似的概念（比如按钮有"幽默、大气、二次元"，用户输入了"搞笑"），请接受。
-2. 如果用户输入是对问题的合理回答（比如问题要求描述风格，用户输入了任何有效的风格描述），请接受。
-3. 只有当用户输入完全不相关、包含不当内容、或明显不合理时，才拒绝。
-请按以下 JSON 格式回复：
-{{
-    "result": "ok|illegal",
-    "parse_vars": {{"{target_variable}": "提取的值"}},
-    "reason": "接受或拒绝的原因"
-}}"""
+3. 如果提供了预定义选项，用户选择这些选项时都应该接受；自定义输入只要是对问题的合理回答即可接受
+4. 对于昵称、姓名、标签等自由文本输入，任何非空的合理表达都应该接受（包括数字、字母、符号、emoji等创意性表达）
+5. 只有当用户回答完全无关、包含不当内容或明显违背常识时才标记为不合法
+6. 宽松验证原则：理解用户意图，接受多样化的合理表达形式"""
 # ========== Error Message Constants ==========
@@ -204,7 +311,7 @@ OPTION_SELECTION_ERROR_TEMPLATE = "请选择以下选项之一：{options}"
 INPUT_EMPTY_ERROR = "输入不能为空"
 # System error messages
-UNSUPPORTED_PROMPT_TYPE_ERROR = "不支持的提示词类型: {prompt_type}"
+UNSUPPORTED_PROMPT_TYPE_ERROR = "不支持的提示词类型: {prompt_type} (支持的类型: base_system, document, interaction, interaction_error)"
 BLOCK_INDEX_OUT_OF_RANGE_ERROR = "Block index {index} is out of range; total={total}"
 LLM_PROVIDER_REQUIRED_ERROR = "需要设置 LLMProvider 才能调用 LLM"
 INTERACTION_PARSE_ERROR = "交互格式解析失败: {error}"
@@ -220,7 +327,11 @@ VARIABLE_DEFAULT_VALUE = "UNKNOWN"
 # Context generation constants
 CONTEXT_QUESTION_MARKER = "# 相关问题"
 CONTEXT_CONVERSATION_MARKER = "# 对话上下文"
+CONTEXT_BUTTON_OPTIONS_MARKER = "## 预定义选项"
 # Context generation templates
 CONTEXT_QUESTION_TEMPLATE = f"{CONTEXT_QUESTION_MARKER}\n{{question}}"
 CONTEXT_CONVERSATION_TEMPLATE = f"{CONTEXT_CONVERSATION_MARKER}\n{{content}}"
+CONTEXT_BUTTON_OPTIONS_TEMPLATE = (
+    f"{CONTEXT_BUTTON_OPTIONS_MARKER}\n可选的预定义选项包括：{{button_options}}\n注意：用户如果选择了这些选项，都应该接受；如果输入了自定义内容，只要是对问题的合理回答即可接受。"
+)

markdown-flow 0.2.19__py3-none-any.whl → 0.2.30__py3-none-any.whl

markdown-flow 0.2.19py3-none-any.whl → 0.2.30py3-none-any.whl