PyPI - botrun-flow-lang - Versions diffs - 5.12.263__py3-none-any.whl → 6.2.21__py3-none-any.whl - Mend

botrun-flow-lang 5.12.263py3-none-any.whl → 6.2.21py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (89) hide show

botrun_flow_lang/api/auth_api.py +39 -39
botrun_flow_lang/api/auth_utils.py +183 -183
botrun_flow_lang/api/botrun_back_api.py +65 -65
botrun_flow_lang/api/flow_api.py +3 -3
botrun_flow_lang/api/hatch_api.py +508 -508
botrun_flow_lang/api/langgraph_api.py +816 -811
botrun_flow_lang/api/langgraph_constants.py +11 -0
botrun_flow_lang/api/line_bot_api.py +1484 -1484
botrun_flow_lang/api/model_api.py +300 -300
botrun_flow_lang/api/rate_limit_api.py +32 -32
botrun_flow_lang/api/routes.py +79 -79
botrun_flow_lang/api/search_api.py +53 -53
botrun_flow_lang/api/storage_api.py +395 -395
botrun_flow_lang/api/subsidy_api.py +290 -290
botrun_flow_lang/api/subsidy_api_system_prompt.txt +109 -109
botrun_flow_lang/api/user_setting_api.py +70 -70
botrun_flow_lang/api/version_api.py +31 -31
botrun_flow_lang/api/youtube_api.py +26 -26
botrun_flow_lang/constants.py +13 -13
botrun_flow_lang/langgraph_agents/agents/agent_runner.py +178 -178
botrun_flow_lang/langgraph_agents/agents/agent_tools/step_planner.py +77 -77
botrun_flow_lang/langgraph_agents/agents/checkpointer/firestore_checkpointer.py +666 -666
botrun_flow_lang/langgraph_agents/agents/gov_researcher/GOV_RESEARCHER_PRD.md +192 -192
botrun_flow_lang/langgraph_agents/agents/gov_researcher/gemini_subsidy_graph.py +460 -460
botrun_flow_lang/langgraph_agents/agents/gov_researcher/gov_researcher_2_graph.py +1002 -1002
botrun_flow_lang/langgraph_agents/agents/gov_researcher/gov_researcher_graph.py +822 -822
botrun_flow_lang/langgraph_agents/agents/langgraph_react_agent.py +730 -723
botrun_flow_lang/langgraph_agents/agents/search_agent_graph.py +864 -864
botrun_flow_lang/langgraph_agents/agents/tools/__init__.py +4 -4
botrun_flow_lang/langgraph_agents/agents/tools/gemini_code_execution.py +376 -376
botrun_flow_lang/langgraph_agents/agents/util/gemini_grounding.py +66 -66
botrun_flow_lang/langgraph_agents/agents/util/html_util.py +316 -316
botrun_flow_lang/langgraph_agents/agents/util/img_util.py +336 -294
botrun_flow_lang/langgraph_agents/agents/util/local_files.py +419 -419
botrun_flow_lang/langgraph_agents/agents/util/mermaid_util.py +86 -86
botrun_flow_lang/langgraph_agents/agents/util/model_utils.py +143 -143
botrun_flow_lang/langgraph_agents/agents/util/pdf_analyzer.py +562 -486
botrun_flow_lang/langgraph_agents/agents/util/pdf_cache.py +250 -250
botrun_flow_lang/langgraph_agents/agents/util/pdf_processor.py +204 -204
botrun_flow_lang/langgraph_agents/agents/util/perplexity_search.py +464 -464
botrun_flow_lang/langgraph_agents/agents/util/plotly_util.py +59 -59
botrun_flow_lang/langgraph_agents/agents/util/tavily_search.py +199 -199
botrun_flow_lang/langgraph_agents/agents/util/usage_metadata.py +34 -0
botrun_flow_lang/langgraph_agents/agents/util/youtube_util.py +90 -90
botrun_flow_lang/langgraph_agents/cache/langgraph_botrun_cache.py +197 -197
botrun_flow_lang/llm_agent/llm_agent.py +19 -19
botrun_flow_lang/llm_agent/llm_agent_util.py +83 -83
botrun_flow_lang/log/.gitignore +2 -2
botrun_flow_lang/main.py +61 -61
botrun_flow_lang/main_fast.py +51 -51
botrun_flow_lang/mcp_server/__init__.py +10 -10
botrun_flow_lang/mcp_server/default_mcp.py +854 -744
botrun_flow_lang/models/nodes/utils.py +205 -205
botrun_flow_lang/models/token_usage.py +34 -34
botrun_flow_lang/requirements.txt +21 -21
botrun_flow_lang/services/base/firestore_base.py +30 -30
botrun_flow_lang/services/hatch/hatch_factory.py +11 -11
botrun_flow_lang/services/hatch/hatch_fs_store.py +419 -419
botrun_flow_lang/services/storage/storage_cs_store.py +206 -206
botrun_flow_lang/services/storage/storage_factory.py +12 -12
botrun_flow_lang/services/storage/storage_store.py +65 -65
botrun_flow_lang/services/user_setting/user_setting_factory.py +9 -9
botrun_flow_lang/services/user_setting/user_setting_fs_store.py +66 -66
botrun_flow_lang/static/docs/tools/index.html +926 -926
botrun_flow_lang/tests/api_functional_tests.py +1525 -1525
botrun_flow_lang/tests/api_stress_test.py +357 -357
botrun_flow_lang/tests/shared_hatch_tests.py +333 -333
botrun_flow_lang/tests/test_botrun_app.py +46 -46
botrun_flow_lang/tests/test_html_util.py +31 -31
botrun_flow_lang/tests/test_img_analyzer.py +190 -190
botrun_flow_lang/tests/test_img_util.py +39 -39
botrun_flow_lang/tests/test_local_files.py +114 -114
botrun_flow_lang/tests/test_mermaid_util.py +103 -103
botrun_flow_lang/tests/test_pdf_analyzer.py +104 -104
botrun_flow_lang/tests/test_plotly_util.py +151 -151
botrun_flow_lang/tests/test_run_workflow_engine.py +65 -65
botrun_flow_lang/tools/generate_docs.py +133 -133
botrun_flow_lang/tools/templates/tools.html +153 -153
botrun_flow_lang/utils/__init__.py +7 -7
botrun_flow_lang/utils/botrun_logger.py +344 -344
botrun_flow_lang/utils/clients/rate_limit_client.py +209 -209
botrun_flow_lang/utils/clients/token_verify_client.py +153 -153
botrun_flow_lang/utils/google_drive_utils.py +654 -654
botrun_flow_lang/utils/langchain_utils.py +324 -324
botrun_flow_lang/utils/yaml_utils.py +9 -9
{botrun_flow_lang-5.12.263.dist-info → botrun_flow_lang-6.2.21.dist-info}/METADATA +6 -6
botrun_flow_lang-6.2.21.dist-info/RECORD +104 -0
botrun_flow_lang-5.12.263.dist-info/RECORD +0 -102
{botrun_flow_lang-5.12.263.dist-info → botrun_flow_lang-6.2.21.dist-info}/WHEEL +0 -0

botrun_flow_lang/langgraph_agents/agents/util/pdf_analyzer.py CHANGED Viewed

@@ -1,486 +1,562 @@
-"""
-PDF 分析模組
-提供 PDF 檔案分析功能，支援：
-- 小檔 (< 5MB)：直接多模態問答
-- 大檔 (>= 5MB)：壓縮 → 切割 → 平行多模態問答 → LLM 統整結果
-"""
-import anthropic
-import asyncio
-import base64
-import httpx
-import os
-from typing import List, Dict, Any
-from dotenv import load_dotenv
-from google.oauth2 import service_account
-load_dotenv()
-# 檔案大小閾值（MB）
-PDF_SIZE_THRESHOLD_MB = 30.0
-# 切片目標大小（MB）
-PDF_CHUNK_TARGET_SIZE_MB = 30.0
-# 最大平行問答數量
-MAX_CONCURRENT_CHUNKS = 5
-def analyze_pdf_with_claude(
-    pdf_data: str, user_input: str, model_name: str = "claude-sonnet-4-5-20250929"
-):
-    """
-    Analyze a PDF file using Claude API
-    Args:
-        pdf_data: Base64-encoded PDF data
-        user_input: User's query about the PDF content
-    Returns:
-        str: Claude's analysis of the PDF content based on the query
-    """
-    # Initialize Anthropic client
-    client = anthropic.Anthropic()
-    # Send to Claude
-    message = client.messages.create(
-        model=model_name,
-        max_tokens=4096,  # Increased token limit for detailed analysis
-        messages=[
-            {
-                "role": "user",
-                "content": [
-                    {
-                        "type": "document",
-                        "source": {
-                            "type": "base64",
-                            "media_type": "application/pdf",
-                            "data": pdf_data,
-                        },
-                    },
-                    {"type": "text", "text": user_input},
-                ],
-            }
-        ],
-    )
-    print(
-        f"analyze_pdf_with_claude============> input_token: {message.usage.input_tokens} output_token: {message.usage.output_tokens}",
-    )
-    return message.content[0].text
-def analyze_pdf_with_gemini(
-    pdf_data: str, user_input: str, model_name: str = "gemini-2.5-flash", pdf_url: str = ""
-):
-    """
-    Analyze a PDF file using Gemini API
-    Args:
-        pdf_data: Base64-encoded PDF data
-        user_input: User's query about the PDF content
-        model_name: Gemini model name to use
-    Returns:
-        str: Gemini's analysis of the PDF content based on the query
-    """
-    # 放到要用的時候才 import，不然loading 會花時間
-    from google import genai
-    from google.genai import types
-    credentials = service_account.Credentials.from_service_account_file(
-        os.getenv("GOOGLE_APPLICATION_CREDENTIALS_FOR_FASTAPI"),
-        scopes=["https://www.googleapis.com/auth/cloud-platform"],
-    )
-    client = genai.Client(
-        credentials=credentials,
-        project="scoop-386004",
-        location="us-central1",
-    )
-    response = client.models.generate_content(
-        model=model_name,
-        contents=[
-            user_input,
-            types.Part(
-                inline_data={
-                    "mime_type": "application/pdf",
-                    "data": pdf_data,
-                }
-            ),
-        ],
-    )
-    # Log token usage if available
-    if hasattr(response, "usage_metadata"):
-        print(
-            f"analyze_pdf_with_gemini============> input_token: {response.usage_metadata.prompt_token_count} output_token: {response.usage_metadata.candidates_token_count}",
-        )
-    print(f"{pdf_url} success")
-    return response.text
-def _analyze_single_chunk(
-    chunk_data: str, page_range: str, user_input: str, model_name: str
-) -> Dict[str, Any]:
-    """
-    分析單一 PDF 切片
-    Args:
-        chunk_data: Base64-encoded PDF chunk data
-        page_range: 頁碼範圍字串 (e.g., "page-001-015")
-        user_input: 使用者問題
-        model_name: 使用的模型名稱
-    Returns:
-        Dict: {"page_range": str, "answer": str, "relevant": bool, "error": str|None}
-    """
-    # 構建切片專用的 prompt
-    chunk_prompt = f"""你正在閱讀一份大型 PDF 文件的其中一部分（{page_range}）。
-使用者問題：{user_input}
-請根據這個部分的內容回答問題：
-- 如果這個部分包含與問題相關的資訊，請詳細回答
-- 如果這個部分與問題完全無關，請只回答「NOT_RELEVANT」（不要回答其他內容）
-- 回答時請標註資訊來源的頁碼"""
-    try:
-        if model_name.startswith("gemini-"):
-            answer = analyze_pdf_with_gemini(chunk_data, chunk_prompt, model_name)
-        elif model_name.startswith("claude-"):
-            answer = analyze_pdf_with_claude(chunk_data, chunk_prompt, model_name)
-        else:
-            return {
-                "page_range": page_range,
-                "answer": "",
-                "relevant": False,
-                "error": f"Unknown model type: {model_name}",
-            }
-        # 判斷是否相關
-        is_relevant = "NOT_RELEVANT" not in answer.upper()
-        return {
-            "page_range": page_range,
-            "answer": answer if is_relevant else "",
-            "relevant": is_relevant,
-            "error": None,
-        }
-    except Exception as e:
-        import traceback
-        traceback.print_exc()
-        return {
-            "page_range": page_range,
-            "answer": "",
-            "relevant": False,
-            "error": str(e),
-        }
-async def analyze_pdf_chunks_parallel(
-    chunks: List[tuple], user_input: str, model_name: str, max_concurrent: int = 5
-) -> List[Dict[str, Any]]:
-    """
-    平行問答多個 PDF 切片
-    Args:
-        chunks: 切片清單 [(chunk_bytes, page_range), ...]
-        user_input: 使用者問題
-        model_name: 使用的模型名稱
-        max_concurrent: 最大平行數量
-    Returns:
-        List[Dict]: 每個切片的回答結果
-    """
-    semaphore = asyncio.Semaphore(max_concurrent)
-    async def analyze_with_semaphore(chunk_bytes: bytes, page_range: str):
-        async with semaphore:
-            # 將 bytes 轉為 base64
-            chunk_data = base64.standard_b64encode(chunk_bytes).decode("utf-8")
-            # 使用 run_in_executor 執行同步函數
-            loop = asyncio.get_event_loop()
-            return await loop.run_in_executor(
-                None,
-                _analyze_single_chunk,
-                chunk_data,
-                page_range,
-                user_input,
-                model_name,
-            )
-    # 建立所有任務
-    tasks = [
-        analyze_with_semaphore(chunk_bytes, page_range)
-        for chunk_bytes, page_range in chunks
-    ]
-    # 平行執行
-    results = await asyncio.gather(*tasks, return_exceptions=True)
-    # 處理例外
-    processed_results = []
-    for i, result in enumerate(results):
-        if isinstance(result, Exception):
-            processed_results.append(
-                {
-                    "page_range": chunks[i][1],
-                    "answer": "",
-                    "relevant": False,
-                    "error": str(result),
-                }
-            )
-        else:
-            processed_results.append(result)
-    return processed_results
-def merge_chunk_results(
-    chunk_results: List[Dict[str, Any]],
-    user_input: str,
-    model_name: str = "gemini-2.5-flash",
-) -> str:
-    """
-    使用 LLM 統整多個切片的回答
-    Args:
-        chunk_results: 切片回答結果清單
-        user_input: 原始使用者問題
-        model_name: 統整使用的模型名稱
-    Returns:
-        str: 統整後的回答
-    """
-    # 過濾出相關的回答
-    relevant_results = [r for r in chunk_results if r.get("relevant", False)]
-    if not relevant_results:
-        # 沒有找到相關內容
-        error_results = [r for r in chunk_results if r.get("error")]
-        if error_results:
-            error_msgs = [f"{r['page_range']}: {r['error']}" for r in error_results]
-            return f"分析 PDF 時發生錯誤：\n" + "\n".join(error_msgs)
-        return "在 PDF 文件中未找到與您問題相關的內容。"
-    # 只有一個相關結果，直接回傳
-    if len(relevant_results) == 1:
-        return relevant_results[0]["answer"]
-    # 多個相關結果，需要統整
-    combined_content = "\n\n".join(
-        [
-            f"【{r['page_range']}】\n{r['answer']}"
-            for r in relevant_results
-        ]
-    )
-    merge_prompt = f"""以下是從一份大型 PDF 文件的不同部分擷取的回答，請統整這些資訊來回答使用者的問題。
-使用者問題：{user_input}
-各部分的回答：
-{combined_content}
-請統整以上資訊，提供一個完整、連貫的回答。如果不同部分有互補的資訊，請整合在一起。請保留頁碼引用。"""
-    try:
-        # 使用 LLM 統整（這裡不需要傳 PDF，只是純文字統整）
-        from google import genai
-        credentials = service_account.Credentials.from_service_account_file(
-            os.getenv("GOOGLE_APPLICATION_CREDENTIALS_FOR_FASTAPI"),
-            scopes=["https://www.googleapis.com/auth/cloud-platform"],
-        )
-        client = genai.Client(
-            credentials=credentials,
-            project="scoop-386004",
-            location="us-central1",
-        )
-        response = client.models.generate_content(
-            model=model_name,
-            contents=[merge_prompt],
-        )
-        if hasattr(response, "usage_metadata"):
-            print(
-                f"merge_chunk_results============> input_token: {response.usage_metadata.prompt_token_count} output_token: {response.usage_metadata.candidates_token_count}",
-            )
-        return response.text
-    except Exception as e:
-        import traceback
-        traceback.print_exc()
-        # 統整失敗，直接回傳合併的內容
-        return f"統整時發生錯誤，以下是各部分的回答：\n\n{combined_content}"
-async def analyze_pdf_async(pdf_url: str, user_input: str) -> str:
-    """
-    非同步分析 PDF 檔案（智慧處理策略）
-    根據檔案大小自動選擇處理策略：
-    - < 5MB: 直接多模態問答
-    - >= 5MB: 壓縮 → 切割 → 平行多模態問答 → LLM 統整結果
-    Args:
-        pdf_url: PDF 檔案的 URL
-        user_input: 使用者問題
-    Returns:
-        str: 分析結果
-    """
-    try:
-        # 1. 下載 PDF
-        print(f"[analyze_pdf_async] 下載 PDF: {pdf_url}")
-        pdf_content = httpx.get(pdf_url, timeout=60.0).content
-        pdf_size_mb = len(pdf_content) / (1024 * 1024)
-        print(f"[analyze_pdf_async] PDF 大小: {pdf_size_mb:.2f} MB")
-        # 取得模型設定
-        models_str = os.getenv("PDF_ANALYZER_MODEL", "gemini-2.5-flash")
-        print(f"[analyze_pdf_async] 使用模型: {models_str}")
-        models = [model.strip() for model in models_str.split(",")]
-        primary_model = models[0]
-        # 2. 判斷處理策略
-        if pdf_size_mb < PDF_SIZE_THRESHOLD_MB:
-            # 小檔：直接多模態問答
-            print(f"[analyze_pdf_async] 小檔模式 (< {PDF_SIZE_THRESHOLD_MB}MB)")
-            pdf_data = base64.standard_b64encode(pdf_content).decode("utf-8")
-            # 嘗試所有模型
-            last_error = None
-            for model in models:
-                try:
-                    if model.startswith("gemini-"):
-                        return analyze_pdf_with_gemini(pdf_data, user_input, model, pdf_url)
-                    elif model.startswith("claude-"):
-                        return analyze_pdf_with_claude(pdf_data, user_input, model)
-                except Exception as e:
-                    import traceback
-                    traceback.print_exc()
-                    last_error = str(e)
-                    continue
-            return f"分析 PDF 時所有模型都失敗。最後錯誤: {last_error}"
-        # 3. 大檔：壓縮 → 切割 → 平行問答 → 統整
-        print(f"[analyze_pdf_async] 大檔模式 (>= {PDF_SIZE_THRESHOLD_MB}MB)")
-        # 延遲 import 以加快載入
-        from botrun_flow_lang.langgraph_agents.agents.util.pdf_processor import (
-            split_pdf_smart,
-            get_pdf_page_count,
-        )
-        from botrun_flow_lang.langgraph_agents.agents.util.pdf_cache import (
-            get_cache_key,
-            check_cache,
-            save_to_cache,
-        )
-        # 3.1 檢查快取
-        cache_key = get_cache_key(pdf_url)
-        print(f"[analyze_pdf_async] 檢查快取: {cache_key}")
-        cached_chunks = await check_cache(cache_key)
-        if cached_chunks:
-            # 有快取，直接使用
-            print(f"[analyze_pdf_async] 使用快取: {len(cached_chunks)} 個切片")
-            chunks = cached_chunks
-            total_pages = sum(
-                int(pr.split("-")[-1]) - int(pr.split("-")[-2]) + 1
-                for _, pr in chunks
-                if pr.startswith("page-")
-            ) if chunks else 0
-        else:
-            # 無快取，切割後存入快取
-            # 3.2 切割
-            print("[analyze_pdf_async] 切割 PDF...")
-            chunks = split_pdf_smart(pdf_content, target_size_mb=PDF_CHUNK_TARGET_SIZE_MB)
-            total_pages = get_pdf_page_count(pdf_content)
-            print(
-                f"[analyze_pdf_async] 切割完成: {len(chunks)} 個切片, 共 {total_pages} 頁"
-            )
-            # 3.3 存入快取
-            print("[analyze_pdf_async] 存入快取...")
-            await save_to_cache(
-                cache_key=cache_key,
-                chunks=chunks,
-                original_url=pdf_url,
-                original_size_mb=pdf_size_mb,
-                total_pages=total_pages,
-            )
-        # 3.3 平行問答
-        print(f"[analyze_pdf_async] 開始平行問答 (最大並行: {MAX_CONCURRENT_CHUNKS})...")
-        chunk_results = await analyze_pdf_chunks_parallel(
-            chunks, user_input, primary_model, max_concurrent=MAX_CONCURRENT_CHUNKS
-        )
-        # 統計結果
-        relevant_count = sum(1 for r in chunk_results if r.get("relevant", False))
-        error_count = sum(1 for r in chunk_results if r.get("error"))
-        print(
-            f"[analyze_pdf_async] 問答完成: {relevant_count}/{len(chunks)} 個切片有相關內容, "
-            f"{error_count} 個錯誤"
-        )
-        # 3.4 統整結果
-        print("[analyze_pdf_async] 統整結果...")
-        result = merge_chunk_results(chunk_results, user_input, primary_model)
-        print("[analyze_pdf_async] 完成")
-        return result
-    except Exception as e:
-        import traceback
-        traceback.print_exc()
-        return f"分析 PDF {pdf_url} 時發生錯誤: {str(e)}"
-def analyze_pdf(pdf_url: str, user_input: str) -> str:
-    """
-    分析 PDF 檔案（同步包裝函數）
-    這是一個同步函數，內部會建立事件迴圈來執行非同步的 analyze_pdf_async。
-    為了向後相容，保留這個同步介面。
-    Args:
-        pdf_url: PDF 檔案的 URL
-        user_input: 使用者問題
-    Returns:
-        str: 分析結果
-    """
-    try:
-        # 嘗試取得現有的事件迴圈
-        loop = asyncio.get_event_loop()
-        if loop.is_running():
-            # 如果已經在事件迴圈中，建立新的任務
-            import concurrent.futures
-            with concurrent.futures.ThreadPoolExecutor() as executor:
-                future = executor.submit(
-                    asyncio.run, analyze_pdf_async(pdf_url, user_input)
-                )
-                return future.result()
-        else:
-            return loop.run_until_complete(analyze_pdf_async(pdf_url, user_input))
-    except RuntimeError:
-        # 沒有事件迴圈，建立新的
-        return asyncio.run(analyze_pdf_async(pdf_url, user_input))
+"""
+PDF 分析模組
+提供 PDF 檔案分析功能，支援：
+- 小檔 (< 5MB)：直接多模態問答
+- 大檔 (>= 5MB)：壓縮 → 切割 → 平行多模態問答 → LLM 統整結果
+"""
+import anthropic
+import asyncio
+import base64
+import httpx
+import os
+from typing import List, Dict, Any, Tuple
+from dotenv import load_dotenv
+from google.oauth2 import service_account
+from botrun_flow_lang.langgraph_agents.agents.util.usage_metadata import UsageMetadata
+load_dotenv()
+# 檔案大小閾值（MB）
+PDF_SIZE_THRESHOLD_MB = 30.0
+# 切片目標大小（MB）
+PDF_CHUNK_TARGET_SIZE_MB = 30.0
+# 最大平行問答數量
+MAX_CONCURRENT_CHUNKS = 5
+def analyze_pdf_with_claude(
+    pdf_data: str, user_input: str, model_name: str = "claude-sonnet-4-5-20250929"
+) -> Tuple[str, UsageMetadata]:
+    """
+    Analyze a PDF file using Claude API
+    Args:
+        pdf_data: Base64-encoded PDF data
+        user_input: User's query about the PDF content
+        model_name: Claude model name to use
+    Returns:
+        Tuple[str, UsageMetadata]: Claude's analysis and usage metadata
+    """
+    # Initialize Anthropic client
+    client = anthropic.Anthropic()
+    # Send to Claude
+    message = client.messages.create(
+        model=model_name,
+        max_tokens=4096,  # Increased token limit for detailed analysis
+        messages=[
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "document",
+                        "source": {
+                            "type": "base64",
+                            "media_type": "application/pdf",
+                            "data": pdf_data,
+                        },
+                    },
+                    {"type": "text", "text": user_input},
+                ],
+            }
+        ],
+    )
+    # Extract usage metadata
+    usage = UsageMetadata(
+        prompt_tokens=message.usage.input_tokens,
+        completion_tokens=message.usage.output_tokens,
+        total_tokens=message.usage.input_tokens + message.usage.output_tokens,
+        cache_creation_input_tokens=getattr(message.usage, 'cache_creation_input_tokens', 0) or 0,
+        cache_read_input_tokens=getattr(message.usage, 'cache_read_input_tokens', 0) or 0,
+        model=model_name,
+    )
+    print(
+        f"analyze_pdf_with_claude============> input_token: {message.usage.input_tokens} output_token: {message.usage.output_tokens}",
+    )
+    return message.content[0].text, usage
+def analyze_pdf_with_gemini(
+    pdf_data: str, user_input: str, model_name: str = "gemini-2.5-flash", pdf_url: str = ""
+) -> Tuple[str, UsageMetadata]:
+    """
+    Analyze a PDF file using Gemini API
+    Args:
+        pdf_data: Base64-encoded PDF data
+        user_input: User's query about the PDF content
+        model_name: Gemini model name to use
+        pdf_url: Original PDF URL for logging
+    Returns:
+        Tuple[str, UsageMetadata]: Gemini's analysis and usage metadata
+    """
+    # 放到要用的時候才 import，不然loading 會花時間
+    from google import genai
+    from google.genai import types
+    credentials = service_account.Credentials.from_service_account_file(
+        os.getenv("GOOGLE_APPLICATION_CREDENTIALS_FOR_FASTAPI"),
+        scopes=["https://www.googleapis.com/auth/cloud-platform"],
+    )
+    client = genai.Client(
+        credentials=credentials,
+        project="scoop-386004",
+        location="us-central1",
+    )
+    response = client.models.generate_content(
+        model=model_name,
+        contents=[
+            user_input,
+            types.Part(
+                inline_data={
+                    "mime_type": "application/pdf",
+                    "data": pdf_data,
+                }
+            ),
+        ],
+    )
+    # Extract usage metadata
+    usage = UsageMetadata(model=model_name)
+    if hasattr(response, "usage_metadata"):
+        usage_meta = response.usage_metadata
+        usage = UsageMetadata(
+            prompt_tokens=getattr(usage_meta, 'prompt_token_count', 0) or 0,
+            completion_tokens=getattr(usage_meta, 'candidates_token_count', 0) or 0,
+            total_tokens=getattr(usage_meta, 'total_token_count', 0) or 0,
+            cache_creation_input_tokens=0,
+            cache_read_input_tokens=getattr(usage_meta, 'cached_content_token_count', 0) or 0,
+            model=model_name,
+        )
+        print(
+            f"analyze_pdf_with_gemini============> input_token: {usage_meta.prompt_token_count} output_token: {usage_meta.candidates_token_count}",
+        )
+    print(f"{pdf_url} success")
+    return response.text, usage
+def _analyze_single_chunk(
+    chunk_data: str, page_range: str, user_input: str, model_name: str
+) -> Dict[str, Any]:
+    """
+    分析單一 PDF 切片
+    Args:
+        chunk_data: Base64-encoded PDF chunk data
+        page_range: 頁碼範圍字串 (e.g., "page-001-015")
+        user_input: 使用者問題
+        model_name: 使用的模型名稱
+    Returns:
+        Dict: {"page_range": str, "answer": str, "relevant": bool, "error": str|None, "usage": UsageMetadata}
+    """
+    # 構建切片專用的 prompt
+    chunk_prompt = f"""你正在閱讀一份大型 PDF 文件的其中一部分（{page_range}）。
+使用者問題：{user_input}
+請根據這個部分的內容回答問題：
+- 如果這個部分包含與問題相關的資訊，請詳細回答
+- 如果這個部分與問題完全無關，請只回答「NOT_RELEVANT」（不要回答其他內容）
+- 回答時請標註資訊來源的頁碼"""
+    try:
+        if model_name.startswith("gemini-"):
+            answer, usage = analyze_pdf_with_gemini(chunk_data, chunk_prompt, model_name)
+        elif model_name.startswith("claude-"):
+            answer, usage = analyze_pdf_with_claude(chunk_data, chunk_prompt, model_name)
+        else:
+            return {
+                "page_range": page_range,
+                "answer": "",
+                "relevant": False,
+                "error": f"Unknown model type: {model_name}",
+                "usage": UsageMetadata(),
+            }
+        # 判斷是否相關
+        is_relevant = "NOT_RELEVANT" not in answer.upper()
+        return {
+            "page_range": page_range,
+            "answer": answer if is_relevant else "",
+            "relevant": is_relevant,
+            "error": None,
+            "usage": usage,
+        }
+    except Exception as e:
+        import traceback
+        traceback.print_exc()
+        return {
+            "page_range": page_range,
+            "answer": "",
+            "relevant": False,
+            "error": str(e),
+            "usage": UsageMetadata(model=model_name),
+        }
+async def analyze_pdf_chunks_parallel(
+    chunks: List[tuple], user_input: str, model_name: str, max_concurrent: int = 5
+) -> Tuple[List[Dict[str, Any]], List[UsageMetadata]]:
+    """
+    平行問答多個 PDF 切片
+    Args:
+        chunks: 切片清單 [(chunk_bytes, page_range), ...]
+        user_input: 使用者問題
+        model_name: 使用的模型名稱
+        max_concurrent: 最大平行數量
+    Returns:
+        Tuple[List[Dict], List[UsageMetadata]]: 每個切片的回答結果和每次呼叫的 usage list
+    """
+    semaphore = asyncio.Semaphore(max_concurrent)
+    async def analyze_with_semaphore(chunk_bytes: bytes, page_range: str):
+        async with semaphore:
+            # 將 bytes 轉為 base64
+            chunk_data = base64.standard_b64encode(chunk_bytes).decode("utf-8")
+            # 使用 run_in_executor 執行同步函數
+            loop = asyncio.get_event_loop()
+            return await loop.run_in_executor(
+                None,
+                _analyze_single_chunk,
+                chunk_data,
+                page_range,
+                user_input,
+                model_name,
+            )
+    # 建立所有任務
+    tasks = [
+        analyze_with_semaphore(chunk_bytes, page_range)
+        for chunk_bytes, page_range in chunks
+    ]
+    # 平行執行
+    results = await asyncio.gather(*tasks, return_exceptions=True)
+    # 處理例外並收集 usage list
+    processed_results = []
+    usage_list = []
+    for i, result in enumerate(results):
+        if isinstance(result, Exception):
+            processed_results.append(
+                {
+                    "page_range": chunks[i][1],
+                    "answer": "",
+                    "relevant": False,
+                    "error": str(result),
+                    "usage": UsageMetadata(model=model_name),
+                }
+            )
+            usage_list.append(UsageMetadata(model=model_name))
+        else:
+            processed_results.append(result)
+            # 收集 usage
+            if "usage" in result and isinstance(result["usage"], UsageMetadata):
+                usage_list.append(result["usage"])
+    return processed_results, usage_list
+def merge_chunk_results(
+    chunk_results: List[Dict[str, Any]],
+    user_input: str,
+    model_name: str = "gemini-2.5-flash",
+) -> Tuple[str, UsageMetadata]:
+    """
+    使用 LLM 統整多個切片的回答
+    Args:
+        chunk_results: 切片回答結果清單
+        user_input: 原始使用者問題
+        model_name: 統整使用的模型名稱
+    Returns:
+        Tuple[str, UsageMetadata]: 統整後的回答和 usage metadata
+    """
+    # 過濾出相關的回答
+    relevant_results = [r for r in chunk_results if r.get("relevant", False)]
+    if not relevant_results:
+        # 沒有找到相關內容
+        error_results = [r for r in chunk_results if r.get("error")]
+        if error_results:
+            error_msgs = [f"{r['page_range']}: {r['error']}" for r in error_results]
+            return f"分析 PDF 時發生錯誤：\n" + "\n".join(error_msgs), UsageMetadata(model=model_name)
+        return "在 PDF 文件中未找到與您問題相關的內容。", UsageMetadata(model=model_name)
+    # 只有一個相關結果，直接回傳（不需要額外的 LLM 呼叫）
+    if len(relevant_results) == 1:
+        return relevant_results[0]["answer"], UsageMetadata(model=model_name)
+    # 多個相關結果，需要統整
+    combined_content = "\n\n".join(
+        [
+            f"【{r['page_range']}】\n{r['answer']}"
+            for r in relevant_results
+        ]
+    )
+    merge_prompt = f"""以下是從一份大型 PDF 文件的不同部分擷取的回答，請統整這些資訊來回答使用者的問題。
+使用者問題：{user_input}
+各部分的回答：
+{combined_content}
+請統整以上資訊，提供一個完整、連貫的回答。如果不同部分有互補的資訊，請整合在一起。請保留頁碼引用。"""
+    try:
+        # 使用 LLM 統整（這裡不需要傳 PDF，只是純文字統整）
+        from google import genai
+        credentials = service_account.Credentials.from_service_account_file(
+            os.getenv("GOOGLE_APPLICATION_CREDENTIALS_FOR_FASTAPI"),
+            scopes=["https://www.googleapis.com/auth/cloud-platform"],
+        )
+        client = genai.Client(
+            credentials=credentials,
+            project="scoop-386004",
+            location="us-central1",
+        )
+        response = client.models.generate_content(
+            model=model_name,
+            contents=[merge_prompt],
+        )
+        # Extract usage metadata
+        usage = UsageMetadata(model=model_name)
+        if hasattr(response, "usage_metadata"):
+            usage_meta = response.usage_metadata
+            usage = UsageMetadata(
+                prompt_tokens=getattr(usage_meta, 'prompt_token_count', 0) or 0,
+                completion_tokens=getattr(usage_meta, 'candidates_token_count', 0) or 0,
+                total_tokens=getattr(usage_meta, 'total_token_count', 0) or 0,
+                cache_creation_input_tokens=0,
+                cache_read_input_tokens=getattr(usage_meta, 'cached_content_token_count', 0) or 0,
+                model=model_name,
+            )
+            print(
+                f"merge_chunk_results============> input_token: {usage_meta.prompt_token_count} output_token: {usage_meta.candidates_token_count}",
+            )
+        return response.text, usage
+    except Exception as e:
+        import traceback
+        traceback.print_exc()
+        # 統整失敗，直接回傳合併的內容
+        return f"統整時發生錯誤，以下是各部分的回答：\n\n{combined_content}", UsageMetadata(model=model_name)
+async def analyze_pdf_async(pdf_url: str, user_input: str) -> Dict[str, Any]:
+    """
+    非同步分析 PDF 檔案（智慧處理策略）
+    根據檔案大小自動選擇處理策略：
+    - < 5MB: 直接多模態問答
+    - >= 5MB: 壓縮 → 切割 → 平行多模態問答 → LLM 統整結果
+    Args:
+        pdf_url: PDF 檔案的 URL
+        user_input: 使用者問題
+    Returns:
+        Dict[str, Any]: {
+            "result": str,  # 分析結果
+            "usage_metadata": List[Dict]  # 每次 LLM 呼叫的 usage 資訊
+        }
+    """
+    usage_list: List[UsageMetadata] = []
+    try:
+        # 1. 下載 PDF
+        print(f"[analyze_pdf_async] 下載 PDF: {pdf_url}")
+        pdf_content = httpx.get(pdf_url, timeout=60.0).content
+        pdf_size_mb = len(pdf_content) / (1024 * 1024)
+        print(f"[analyze_pdf_async] PDF 大小: {pdf_size_mb:.2f} MB")
+        # 取得模型設定
+        models_str = os.getenv("PDF_ANALYZER_MODEL", "gemini-2.5-flash")
+        print(f"[analyze_pdf_async] 使用模型: {models_str}")
+        models = [model.strip() for model in models_str.split(",")]
+        primary_model = models[0]
+        # 2. 判斷處理策略
+        if pdf_size_mb < PDF_SIZE_THRESHOLD_MB:
+            # 小檔：直接多模態問答
+            print(f"[analyze_pdf_async] 小檔模式 (< {PDF_SIZE_THRESHOLD_MB}MB)")
+            pdf_data = base64.standard_b64encode(pdf_content).decode("utf-8")
+            # 嘗試所有模型
+            last_error = None
+            for model in models:
+                try:
+                    if model.startswith("gemini-"):
+                        result, usage = analyze_pdf_with_gemini(pdf_data, user_input, model, pdf_url)
+                        usage_list.append(usage)
+                        return {
+                            "result": result,
+                            "usage_metadata": [u.to_dict() for u in usage_list],
+                        }
+                    elif model.startswith("claude-"):
+                        result, usage = analyze_pdf_with_claude(pdf_data, user_input, model)
+                        usage_list.append(usage)
+                        return {
+                            "result": result,
+                            "usage_metadata": [u.to_dict() for u in usage_list],
+                        }
+                except Exception as e:
+                    import traceback
+                    traceback.print_exc()
+                    last_error = str(e)
+                    continue
+            return {
+                "result": f"分析 PDF 時所有模型都失敗。最後錯誤: {last_error}",
+                "usage_metadata": [u.to_dict() for u in usage_list],
+            }
+        # 3. 大檔：壓縮 → 切割 → 平行問答 → 統整
+        print(f"[analyze_pdf_async] 大檔模式 (>= {PDF_SIZE_THRESHOLD_MB}MB)")
+        # 延遲 import 以加快載入
+        from botrun_flow_lang.langgraph_agents.agents.util.pdf_processor import (
+            split_pdf_smart,
+            get_pdf_page_count,
+        )
+        from botrun_flow_lang.langgraph_agents.agents.util.pdf_cache import (
+            get_cache_key,
+            check_cache,
+            save_to_cache,
+        )
+        # 3.1 檢查快取
+        cache_key = get_cache_key(pdf_url)
+        print(f"[analyze_pdf_async] 檢查快取: {cache_key}")
+        cached_chunks = await check_cache(cache_key)
+        if cached_chunks:
+            # 有快取，直接使用
+            print(f"[analyze_pdf_async] 使用快取: {len(cached_chunks)} 個切片")
+            chunks = cached_chunks
+            total_pages = sum(
+                int(pr.split("-")[-1]) - int(pr.split("-")[-2]) + 1
+                for _, pr in chunks
+                if pr.startswith("page-")
+            ) if chunks else 0
+        else:
+            # 無快取，切割後存入快取
+            # 3.2 切割
+            print("[analyze_pdf_async] 切割 PDF...")
+            chunks = split_pdf_smart(pdf_content, target_size_mb=PDF_CHUNK_TARGET_SIZE_MB)
+            total_pages = get_pdf_page_count(pdf_content)
+            print(
+                f"[analyze_pdf_async] 切割完成: {len(chunks)} 個切片, 共 {total_pages} 頁"
+            )
+            # 3.3 存入快取
+            print("[analyze_pdf_async] 存入快取...")
+            await save_to_cache(
+                cache_key=cache_key,
+                chunks=chunks,
+                original_url=pdf_url,
+                original_size_mb=pdf_size_mb,
+                total_pages=total_pages,
+            )
+        # 3.3 平行問答
+        print(f"[analyze_pdf_async] 開始平行問答 (最大並行: {MAX_CONCURRENT_CHUNKS})...")
+        chunk_results, chunk_usage_list = await analyze_pdf_chunks_parallel(
+            chunks, user_input, primary_model, max_concurrent=MAX_CONCURRENT_CHUNKS
+        )
+        usage_list.extend(chunk_usage_list)
+        # 統計結果
+        relevant_count = sum(1 for r in chunk_results if r.get("relevant", False))
+        error_count = sum(1 for r in chunk_results if r.get("error"))
+        print(
+            f"[analyze_pdf_async] 問答完成: {relevant_count}/{len(chunks)} 個切片有相關內容, "
+            f"{error_count} 個錯誤"
+        )
+        # 3.4 統整結果
+        print("[analyze_pdf_async] 統整結果...")
+        result, merge_usage = merge_chunk_results(chunk_results, user_input, primary_model)
+        # 只有當 merge_usage 有實際 token 使用時才加入（避免加入空的 usage）
+        if merge_usage.prompt_tokens > 0 or merge_usage.completion_tokens > 0:
+            usage_list.append(merge_usage)
+        print("[analyze_pdf_async] 完成")
+        return {
+            "result": result,
+            "usage_metadata": [u.to_dict() for u in usage_list],
+        }
+    except Exception as e:
+        import traceback
+        traceback.print_exc()
+        return {
+            "result": f"分析 PDF {pdf_url} 時發生錯誤: {str(e)}",
+            "usage_metadata": [u.to_dict() for u in usage_list],
+        }
+def analyze_pdf(pdf_url: str, user_input: str) -> Dict[str, Any]:
+    """
+    分析 PDF 檔案（同步包裝函數）
+    這是一個同步函數，內部會建立事件迴圈來執行非同步的 analyze_pdf_async。
+    為了向後相容，保留這個同步介面。
+    Args:
+        pdf_url: PDF 檔案的 URL
+        user_input: 使用者問題
+    Returns:
+        Dict[str, Any]: {
+            "result": str,  # 分析結果
+            "usage_metadata": List[Dict]  # 每次 LLM 呼叫的 usage 資訊
+        }
+    """
+    try:
+        # 嘗試取得現有的事件迴圈
+        loop = asyncio.get_event_loop()
+        if loop.is_running():
+            # 如果已經在事件迴圈中，建立新的任務
+            import concurrent.futures
+            with concurrent.futures.ThreadPoolExecutor() as executor:
+                future = executor.submit(
+                    asyncio.run, analyze_pdf_async(pdf_url, user_input)
+                )
+                return future.result()
+        else:
+            return loop.run_until_complete(analyze_pdf_async(pdf_url, user_input))
+    except RuntimeError:
+        # 沒有事件迴圈，建立新的
+        return asyncio.run(analyze_pdf_async(pdf_url, user_input))

botrun-flow-lang 5.12.263__py3-none-any.whl → 6.2.21__py3-none-any.whl

botrun-flow-lang 5.12.263py3-none-any.whl → 6.2.21py3-none-any.whl