PyPI - markdown-flow - Versions diffs - 0.2.10__py3-none-any.whl → 0.2.30__py3-none-any.whl - Mend

markdown-flow 0.2.10py3-none-any.whl → 0.2.30py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (23) hide show

markdown_flow/__init__.py +7 -7
markdown_flow/constants.py +212 -49
markdown_flow/core.py +614 -591
markdown_flow/llm.py +10 -12
markdown_flow/models.py +1 -17
markdown_flow/parser/__init__.py +38 -0
markdown_flow/parser/code_fence_utils.py +190 -0
markdown_flow/parser/interaction.py +354 -0
markdown_flow/parser/json_parser.py +50 -0
markdown_flow/parser/output.py +215 -0
markdown_flow/parser/preprocessor.py +151 -0
markdown_flow/parser/validation.py +100 -0
markdown_flow/parser/variable.py +95 -0
markdown_flow/providers/__init__.py +16 -0
markdown_flow/providers/config.py +46 -0
markdown_flow/providers/openai.py +369 -0
markdown_flow/utils.py +49 -51
{markdown_flow-0.2.10.dist-info → markdown_flow-0.2.30.dist-info}/METADATA +18 -107
markdown_flow-0.2.30.dist-info/RECORD +24 -0
markdown_flow-0.2.10.dist-info/RECORD +0 -13
{markdown_flow-0.2.10.dist-info → markdown_flow-0.2.30.dist-info}/WHEEL +0 -0
{markdown_flow-0.2.10.dist-info → markdown_flow-0.2.30.dist-info}/licenses/LICENSE +0 -0
{markdown_flow-0.2.10.dist-info → markdown_flow-0.2.30.dist-info}/top_level.txt +0 -0

markdown_flow/__init__.py CHANGED Viewed

@@ -9,7 +9,7 @@ Core Features:
     - Extract variable placeholders ({{variable}} and %{{variable}} formats)
     - Build LLM-ready prompts and message formats
     - Handle user interaction validation and input processing
-    - Support multiple processing modes: PROMPT_ONLY, COMPLETE, STREAM
+    - Support multiple processing modes: COMPLETE, STREAM
 Supported Interaction Types:
     - TEXT_ONLY: ?[%{{var}}...question] - Text input only
@@ -32,12 +32,11 @@ Basic Usage:
     blocks = mf.get_all_blocks()
     # Process blocks using unified interface
-    result = await mf.process(0, variables={'name': 'John'}, mode=ProcessMode.COMPLETE)
+    result = mf.process(0, variables={'name': 'John'}, mode=ProcessMode.COMPLETE)
     # Different processing modes
-    prompt_result = await mf.process(0, mode=ProcessMode.PROMPT_ONLY)
-    complete_result = await mf.process(0, mode=ProcessMode.COMPLETE)
-    stream_result = await mf.process(0, mode=ProcessMode.STREAM)
+    complete_result = mf.process(0, mode=ProcessMode.COMPLETE)
+    stream_result = mf.process(0, mode=ProcessMode.STREAM)
 Variable System:
     - {{variable}} - Regular variables, replaced with actual values
@@ -53,7 +52,7 @@ Import Guide:
 from .core import MarkdownFlow
 from .enums import BlockType, InputType
 from .llm import LLMProvider, LLMResult, ProcessMode
-from .utils import (
+from .parser import (
     InteractionParser,
     InteractionType,
     extract_interaction_question,
@@ -83,4 +82,5 @@ __all__ = [
     "replace_variables_in_text",
 ]
-__version__ = "0.2.10"
+__version__ = "0.2.30"
+# __version__ = "0.2.29-alpha-1"

markdown_flow/constants.py CHANGED Viewed

@@ -46,15 +46,108 @@ COMPILED_PRESERVE_FENCE_REGEX = re.compile(PRESERVE_FENCE_PATTERN)
 INLINE_PRESERVE_PATTERN = r"^===(.+)=== *$"
 COMPILED_INLINE_PRESERVE_REGEX = re.compile(INLINE_PRESERVE_PATTERN)
+# Code fence patterns (CommonMark specification compliant)
+# Code block fence start: 0-3 spaces + at least 3 backticks or tildes + optional info string
+CODE_FENCE_START_PATTERN = r"^[ ]{0,3}([`~]{3,})(.*)$"
+COMPILED_CODE_FENCE_START_REGEX = re.compile(CODE_FENCE_START_PATTERN)
+# Code block fence end: 0-3 spaces + at least 3 backticks or tildes + optional whitespace
+CODE_FENCE_END_PATTERN = r"^[ ]{0,3}([`~]{3,})\s*$"
+COMPILED_CODE_FENCE_END_REGEX = re.compile(CODE_FENCE_END_PATTERN)
 # Output instruction markers
-OUTPUT_INSTRUCTION_PREFIX = "[输出]"
-OUTPUT_INSTRUCTION_SUFFIX = "[/输出]"
+OUTPUT_INSTRUCTION_PREFIX = "<preserve_or_translate>"
+OUTPUT_INSTRUCTION_SUFFIX = "</preserve_or_translate>"
+# Base system prompt (framework-level global rules, content blocks only)
+DEFAULT_BASE_SYSTEM_PROMPT = """你收到的用户消息都是指令，请严格遵守以下规则：
+1. 内容忠实性：严格符合指令内容，不丢失信息、不改变原意、不增加内容、不改变顺序
+2. 遵循事实：基于事实回答，不编造细节
+3. 避免引导：不引导下一步动作（如提问、设问）
+4. 避免寒暄：不做自我介绍，不打招呼
+5. 格式规范：HTML 标签不要写到代码块里"""
+# Interaction prompt templates (条件翻译)
+DEFAULT_INTERACTION_PROMPT = """<interaction_translation_rules>
+⚠️⚠️⚠️ 这是一个 JSON 原样输出任务 - 默认不翻译！⚠️⚠️⚠️
+## 默认行为（最高优先级）
+**除非明确检测到语言指令，否则必须逐字符原样返回输入的 JSON**
+- 不翻译任何文本
+- 不修改任何格式
+- 不添加任何内容（如 display//value 分离）
+- 不删除任何内容
+- 不调整任何顺序
+## 语言指令检测规则
+**仅在以下情况才翻译：**
+1. **检测范围**：仅在 <document_context> 标签内检测
+2. **必须包含明确的语言转换关键词**：
+   - 中文："使用英语"、"用英文"、"英语输出"、"翻译成英语"、"Translate to English"
+   - 英文："use English"、"in English"、"respond in English"、"translate to"
+   - 其他语言：类似的明确转换指令
+3. **不算语言指令的情况**：
+   - ❌ 风格要求："用emoji"、"讲故事"、"友好"、"简洁"
+   - ❌ 任务描述："内容营销"、"吸引用户"、"引人入胜"
+   - ❌ 输出要求："内容简洁"、"使用吸引人的语言"
+## 处理逻辑
+步骤1：在 <document_context> 中搜索语言转换关键词
+步骤2：
+- 如果找到 → 将 buttons 和 question 翻译成指定语言（仅翻译文本，不改格式）
+- 如果未找到 → 逐字符原样返回输入的 JSON
+## 输出格式要求
+- **必须返回纯 JSON**，不要添加任何解释或 markdown 代码块
+- **格式必须与输入完全一致**，包括空格、标点、引号
+## 示例
+### 示例 1：无语言指令（默认情况）
+输入：{"buttons": ["产品经理", "开发者", "大学生"], "question": "其他身份"}
-# System message templates
-DEFAULT_VALIDATION_SYSTEM_MESSAGE = "你是一个输入验证助手，需要严格按照指定的格式和规则处理用户输入。"
+<document_context>
+你是一个内容营销，擅长结合用户特点，给到引人入胜的内容。
+任务说明：认真理解给定的内容，站在用户角度...
+输出要求：内容简洁有力，使用吸引用户的语言...
+</document_context>
-# Interaction prompt templates
-DEFAULT_INTERACTION_PROMPT = "请将后面交互提示改写得更个性化和友好，长度尽量和原始内容一致，保持原有的功能性和变量格式不变："
+✅ 正确输出：{"buttons": ["产品经理", "开发者", "大学生"], "question": "其他身份"}
+❌ 错误输出：{"buttons": ["Product Manager//产品经理", ...], ...}  ← 不要添加翻译！
+### 示例 2：有明确语言指令
+输入：{"buttons": ["苹果", "香蕉"], "question": "其他水果"}
+<document_context>
+请使用英语输出所有内容。
+</document_context>
+✅ 正确输出：{"buttons": ["Apple", "Banana"], "question": "Other fruit"}
+### 示例 3：仅有风格指令（不算语言指令）
+输入：{"buttons": ["选项A", "选项B"], "question": "其他"}
+<document_context>
+请用emoji和故事化的方式呈现内容。
+</document_context>
+✅ 正确输出：{"buttons": ["选项A", "选项B"], "question": "其他"}  ← 保持原样！
+⚠️⚠️⚠️ 最终强调 ⚠️⚠️⚠️
+- 默认行为：原样输出，不做任何改动
+- 只有在 <document_context> 中明确看到"使用XX语言"、"translate to"等关键词时才翻译
+- 如有任何疑问，必须原样输出
+</interaction_translation_rules>"""
 # Interaction error prompt templates
 DEFAULT_INTERACTION_ERROR_PROMPT = "请将以下错误信息改写得更加友好和个性化，帮助用户理解问题并给出建设性的引导："
@@ -90,60 +183,126 @@ VALIDATION_RESPONSE_OK = "ok"
 VALIDATION_RESPONSE_ILLEGAL = "illegal"
 # Output instruction processing
-OUTPUT_INSTRUCTION_EXPLANATION = f"""请按照以下指令执行：
+OUTPUT_INSTRUCTION_EXPLANATION = f"""<preserve_or_translate_instruction>
+⚠️⚠️⚠️ 保留内容输出任务 - 默认原样输出！⚠️⚠️⚠️
-当遇到{OUTPUT_INSTRUCTION_PREFIX}content{OUTPUT_INSTRUCTION_SUFFIX}这样的标签对时：
-1. **完全原样输出**中间的content内容，不要进行任何格式转换或修改
-2. 不要输出{OUTPUT_INSTRUCTION_PREFIX}和{OUTPUT_INSTRUCTION_SUFFIX}标签本身
-3. 即使content内容包含标题符号（如#）、特殊格式等，也要原样输出，不要转换成Markdown格式
-4. 保持content中的所有原始字符、空格、换行符等
-5. 然后继续执行后面的指令
+## 默认行为（最高优先级）
-重要提醒：
-- {OUTPUT_INSTRUCTION_PREFIX}和{OUTPUT_INSTRUCTION_SUFFIX}只是指令标记，不要将这些标记作为内容输出
-- 标签内的内容必须原样输出，不要按照文档提示词的格式要求进行转换
-- 这是绝对的输出指令，优先级高于任何格式要求
+**看到 {OUTPUT_INSTRUCTION_PREFIX}...{OUTPUT_INSTRUCTION_SUFFIX} 标记时，必须将标记内的内容输出到回复中（保持原位置）**
+- 默认：逐字符原样输出，不做任何改动
+- 绝对不要输出 {OUTPUT_INSTRUCTION_PREFIX} 和 {OUTPUT_INSTRUCTION_SUFFIX} 标记本身
+- 始终保留 emoji、格式、特殊字符
-"""
+## 语言指令检测规则
-# Smart validation template
-SMART_VALIDATION_TEMPLATE = """# 任务
-从用户回答中提取相关信息，返回JSON格式结果：
-- 合法：{{"result": "ok", "parse_vars": {{"{target_variable}": "提取的内容"}}}}
-- 不合法：{{"result": "illegal", "reason": "原因"}}
+**仅在以下情况才翻译：**
-{context_info}
+1. **检测范围**：仅在 <document_prompt> 标签内检测
+2. **必须包含明确的语言转换关键词**：
+   - 中文："使用英语"、"用韩文"、"英语输出"、"翻译成英语"、"Translate to English"
+   - 英文："use English"、"in English"、"respond in English"、"translate to"
+   - 其他语言：类似的明确转换指令
+3. **不算语言指令的情况**：
+   - ❌ 风格要求："用emoji"、"讲故事"、"友好"、"简洁"
+   - ❌ 任务描述："内容营销"、"吸引用户"、"引人入胜"
+   - ❌ 输出要求："内容简洁"、"使用吸引人的语言"
-# 用户回答
-{sys_user_input}
+## 处理逻辑
-# 提取要求
-1. 仔细阅读上述相关问题，理解这个问题想要获取什么信息
-2. 从用户回答中提取与该问题相关的信息
-3. 对于昵称/姓名类问题，任何非空的合理字符串（包括简短的如"ee"、"aa"、"007"等）都应该接受
-4. 只有当用户回答完全无关、包含不当内容或明显不合理时才标记为不合法
-5. 确保提取的信息准确、完整且符合预期格式"""
+步骤1：在 <document_prompt> 中搜索语言转换关键词
+步骤2：
+- 如果找到 → 保持原意与风格，翻译成指定语言
+- 如果未找到 → 逐字符原样输出，不做任何改动
+## 输出位置规则
-# Validation template for buttons with text input
-BUTTONS_WITH_TEXT_VALIDATION_TEMPLATE = """用户针对以下问题进行了输入：
+- 保持内容在原文档中的位置（开头/中间/结尾）
+- 不要强制移到开头或其他位置
-问题：{question}
-可选按钮：{options}
-用户输入：{user_input}
+## 示例
-用户的输入不在预定义的按钮选项中，这意味着用户选择了自定义输入。
-根据问题的性质，请判断用户的输入是否合理：
+### 示例 1：无语言指令（默认情况）
-1. 如果用户输入能够表达与按钮选项类似的概念（比如按钮有"幽默、大气、二次元"，用户输入了"搞笑"），请接受。
-2. 如果用户输入是对问题的合理回答（比如问题要求描述风格，用户输入了任何有效的风格描述），请接受。
-3. 只有当用户输入完全不相关、包含不当内容、或明显不合理时，才拒绝。
+输入: {OUTPUT_INSTRUCTION_PREFIX}🌟 欢迎冒险！{OUTPUT_INSTRUCTION_SUFFIX}
-请按以下 JSON 格式回复：
-{{
-    "result": "ok|illegal",
-    "parse_vars": {{"{target_variable}": "提取的值"}},
-    "reason": "接受或拒绝的原因"
-}}"""
+询问小朋友的名字：
+<document_prompt>
+你是一个故事大王，擅长讲故事。
+用一些语气词，多用emoji。
+</document_prompt>
+✅ 正确输出: 🌟 欢迎冒险！
+询问小朋友的名字：...（保留内容在开头，原样输出）
+❌ 错误输出: 询问小朋友的名字：...（完全不输出保留内容 ← 绝对禁止！）
+### 示例 2：有明确语言指令
+输入: {OUTPUT_INSTRUCTION_PREFIX}🌟 欢迎冒险！{OUTPUT_INSTRUCTION_SUFFIX}
+询问小朋友的名字：
+<document_prompt>
+请使用韩语输出所有内容。
+</document_prompt>
+✅ 正确输出: 🌟 모험에 오신 것을 환영합니다!
+아이의 이름을 물어보세요：...（保留内容翻译为韩语）
+### 示例 3：仅有风格指令（不算语言指令）
+输入: {OUTPUT_INSTRUCTION_PREFIX}**重要提示**{OUTPUT_INSTRUCTION_SUFFIX}
+后续内容...
+<document_prompt>
+请用emoji和故事化的方式呈现内容。
+</document_prompt>
+✅ 正确输出: **重要提示**
+后续内容...（保持原样！）
+### 示例 4：标记剥离错误
+输入: {OUTPUT_INSTRUCTION_PREFIX}**Title**{OUTPUT_INSTRUCTION_SUFFIX}
+❌ 绝对不要: {OUTPUT_INSTRUCTION_PREFIX}**Title**{OUTPUT_INSTRUCTION_SUFFIX}（包含了标记）
+✅ 正确输出: **Title**（排除了标记）
+⚠️⚠️⚠️ 最终强调 ⚠️⚠️⚠️
+- 默认行为：原样输出保留内容，不做任何改动
+- 只有在 <document_prompt> 中明确看到"使用XX语言"、"translate to"等关键词时才翻译
+- 如有任何疑问，必须原样输出
+- 此规则优先级最高，覆盖所有其他指令
+</preserve_or_translate_instruction>
+"""
+# Validation task template (merged with system message)
+VALIDATION_TASK_TEMPLATE = """你是一个验证用户输入的助手，请严格按照给定的指令进行验证。
+# 任务
+从用户回答中提取相关信息，返回JSON格式结果：
+- 合法：{{"result": "ok", "parse_vars": {{"{target_variable}": "提取的内容"}}}}
+- 不合法：{{"result": "illegal", "reason": "原因"}}
+# 输出语言
+- 如果在 <document_context> 中明确要求使用特定语言，则错误信息和原因说明应使用该语言
+- 否则，使用用户输入或问题描述的主要语言"""
+# Validation requirements template (lenient general version)
+VALIDATION_REQUIREMENTS_TEMPLATE = """# 提取要求
+1. 仔细阅读上述相关问题，理解这个问题想要获取什么信息
+2. 从用户回答中提取与该问题相关的信息
+3. 如果提供了预定义选项，用户选择这些选项时都应该接受；自定义输入只要是对问题的合理回答即可接受
+4. 对于昵称、姓名、标签等自由文本输入，任何非空的合理表达都应该接受（包括数字、字母、符号、emoji等创意性表达）
+5. 只有当用户回答完全无关、包含不当内容或明显违背常识时才标记为不合法
+6. 宽松验证原则：理解用户意图，接受多样化的合理表达形式"""
 # ========== Error Message Constants ==========
@@ -152,7 +311,7 @@ OPTION_SELECTION_ERROR_TEMPLATE = "请选择以下选项之一：{options}"
 INPUT_EMPTY_ERROR = "输入不能为空"
 # System error messages
-UNSUPPORTED_PROMPT_TYPE_ERROR = "不支持的提示词类型: {prompt_type}"
+UNSUPPORTED_PROMPT_TYPE_ERROR = "不支持的提示词类型: {prompt_type} (支持的类型: base_system, document, interaction, interaction_error)"
 BLOCK_INDEX_OUT_OF_RANGE_ERROR = "Block index {index} is out of range; total={total}"
 LLM_PROVIDER_REQUIRED_ERROR = "需要设置 LLMProvider 才能调用 LLM"
 INTERACTION_PARSE_ERROR = "交互格式解析失败: {error}"
@@ -168,7 +327,11 @@ VARIABLE_DEFAULT_VALUE = "UNKNOWN"
 # Context generation constants
 CONTEXT_QUESTION_MARKER = "# 相关问题"
 CONTEXT_CONVERSATION_MARKER = "# 对话上下文"
+CONTEXT_BUTTON_OPTIONS_MARKER = "## 预定义选项"
 # Context generation templates
 CONTEXT_QUESTION_TEMPLATE = f"{CONTEXT_QUESTION_MARKER}\n{{question}}"
 CONTEXT_CONVERSATION_TEMPLATE = f"{CONTEXT_CONVERSATION_MARKER}\n{{content}}"
+CONTEXT_BUTTON_OPTIONS_TEMPLATE = (
+    f"{CONTEXT_BUTTON_OPTIONS_MARKER}\n可选的预定义选项包括：{{button_options}}\n注意：用户如果选择了这些选项，都应该接受；如果输入了自定义内容，只要是对问题的合理回答即可接受。"
+)

markdown-flow 0.2.10__py3-none-any.whl → 0.2.30__py3-none-any.whl

markdown-flow 0.2.10py3-none-any.whl → 0.2.30py3-none-any.whl