PyPI - devlake-mcp - Versions diffs - 0.4.1__py3-none-any.whl - Mend

devlake-mcp 0.4.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (31) hide show

devlake_mcp/__init__.py +7 -0
devlake_mcp/__main__.py +10 -0
devlake_mcp/cli.py +794 -0
devlake_mcp/client.py +474 -0
devlake_mcp/compat.py +165 -0
devlake_mcp/config.py +204 -0
devlake_mcp/constants.py +161 -0
devlake_mcp/enums.py +58 -0
devlake_mcp/generation_manager.py +296 -0
devlake_mcp/git_utils.py +489 -0
devlake_mcp/hooks/__init__.py +49 -0
devlake_mcp/hooks/hook_utils.py +246 -0
devlake_mcp/hooks/post_tool_use.py +325 -0
devlake_mcp/hooks/pre_tool_use.py +110 -0
devlake_mcp/hooks/record_session.py +183 -0
devlake_mcp/hooks/session_start.py +81 -0
devlake_mcp/hooks/stop.py +275 -0
devlake_mcp/hooks/transcript_utils.py +547 -0
devlake_mcp/hooks/user_prompt_submit.py +204 -0
devlake_mcp/logging_config.py +202 -0
devlake_mcp/retry_queue.py +556 -0
devlake_mcp/server.py +664 -0
devlake_mcp/session_manager.py +444 -0
devlake_mcp/utils.py +225 -0
devlake_mcp/version_utils.py +174 -0
devlake_mcp-0.4.1.dist-info/METADATA +541 -0
devlake_mcp-0.4.1.dist-info/RECORD +31 -0
devlake_mcp-0.4.1.dist-info/WHEEL +5 -0
devlake_mcp-0.4.1.dist-info/entry_points.txt +3 -0
devlake_mcp-0.4.1.dist-info/licenses/LICENSE +21 -0
devlake_mcp-0.4.1.dist-info/top_level.txt +1 -0

devlake_mcp/hooks/record_session.py ADDED Viewed

@@ -0,0 +1,183 @@
+#!/usr/bin/env python3
+"""
+记录 AI 编码会话信息（SessionEnd Hook）
+触发时机：会话真正结束时（/clear、logout、退出程序等）
+触发频率：每个会话只触发一次
+功能：
+1. 统计对话轮次（从 transcript）
+2. 更新会话记录（PATCH /api/ai-coding/sessions/{session_id}）
+3. 上传 transcript 完整内容（POST /api/ai-coding/transcripts）
+4. API 后端自动计算会话时长
+注意：
+- 不要放在 Stop hook 中，那会在每次对话结束时触发（多次调用）
+- SessionEnd 才是真正的会话结束，只触发一次
+"""
+import json
+import sys
+import os
+import logging
+from datetime import datetime
+from pathlib import Path
+# 导入公共工具（使用包导入）
+from devlake_mcp.hooks.transcript_utils import (
+    count_user_messages,
+    read_transcript_content,
+    compress_transcript_content,
+)
+from devlake_mcp.hooks.hook_utils import run_async
+from devlake_mcp.client import DevLakeClient
+from devlake_mcp.session_manager import clear_session
+from devlake_mcp.logging_config import configure_logging, get_log_dir
+from devlake_mcp.constants import HOOK_LOG_DIR
+# 配置日志（启动时调用一次）
+configure_logging(log_dir=get_log_dir(HOOK_LOG_DIR), log_file='record_session.log')
+logger = logging.getLogger(__name__)
+def _validate_input(input_data: dict) -> tuple[str, str]:
+    """验证输入数据的有效性
+    Args:
+        input_data: Hook 输入数据
+    Returns:
+        tuple[session_id, transcript_path]
+    Raises:
+        SystemExit: 如果验证失败，退出程序
+    """
+    hook_event_name = input_data.get('hook_event_name')
+    if hook_event_name != 'SessionEnd':
+        sys.exit(0)
+    session_id = input_data.get('session_id')
+    if not session_id:
+        sys.exit(0)
+    transcript_path = input_data.get('transcript_path', '')
+    return session_id, transcript_path
+def _update_session(client: DevLakeClient, session_id: str, conversation_rounds: int) -> None:
+    """更新会话记录
+    Args:
+        client: DevLake 客户端
+        session_id: 会话 ID
+        conversation_rounds: 对话轮次
+    """
+    update_data = {
+        'session_id': session_id,
+        'session_end_time': datetime.now().isoformat(),
+        'conversation_rounds': conversation_rounds
+    }
+    try:
+        client.update_session(session_id, update_data)
+    except Exception:
+        logger.error(f'Failed to update session {session_id}', exc_info=True)
+def _upload_transcript(client: DevLakeClient, session_id: str,
+                      transcript_path: str, conversation_rounds: int) -> None:
+    """上传 transcript 内容（支持智能压缩）
+    Args:
+        client: DevLake 客户端
+        session_id: 会话 ID
+        transcript_path: transcript 文件路径
+        conversation_rounds: 对话轮次
+    功能：
+        1. 读取 transcript 原始内容
+        2. 智能压缩（大于 1MB 时自动启用 gzip 压缩）
+        3. 上传到 DevLake API
+    """
+    if not transcript_path or not os.path.exists(transcript_path):
+        return
+    try:
+        # 1. 读取原始内容
+        transcript_content = read_transcript_content(transcript_path)
+        original_size = os.path.getsize(transcript_path)
+        # 2. 智能压缩
+        compression_result = compress_transcript_content(transcript_content)
+        # 3. 准备上传数据
+        transcript_data = {
+            'session_id': session_id,
+            'transcript_path': transcript_path,
+            'transcript_content': compression_result['content'],
+            'compression': compression_result['compression'],
+            'original_size': compression_result['original_size'],
+            'compressed_size': compression_result['compressed_size'],
+            'compression_ratio': compression_result.get('compression_ratio', 0.0),
+            'message_count': conversation_rounds,
+            'upload_time': datetime.now().isoformat()
+        }
+        # 4. 上传
+        client.create_transcript(transcript_data)
+        # 5. 记录日志
+        if compression_result['compression'] == 'gzip':
+            logger.info(
+                f"Transcript 上传成功 (已压缩): {session_id}, "
+                f"原始大小: {original_size} bytes, "
+                f"压缩后: {compression_result['compressed_size']} bytes, "
+                f"压缩率: {compression_result['compression_ratio']:.1f}%"
+            )
+        else:
+            logger.info(
+                f"Transcript 上传成功 (未压缩): {session_id}, "
+                f"大小: {original_size} bytes"
+            )
+    except Exception:
+        logger.error(f'Failed to upload transcript for {session_id}', exc_info=True)
+@run_async
+def main():
+    """SessionEnd Hook 主入口：记录会话结束信息"""
+    try:
+        # 1. 读取并验证输入
+        input_data = json.load(sys.stdin)
+        session_id, transcript_path = _validate_input(input_data)
+        # 2. 统计对话轮次
+        conversation_rounds = count_user_messages(transcript_path)
+        # 3. 初始化客户端（复用）
+        client = DevLakeClient()
+        # 4. 更新会话记录
+        _update_session(client, session_id, conversation_rounds)
+        # 5. 上传 transcript 内容
+        _upload_transcript(client, session_id, transcript_path, conversation_rounds)
+        # 6. 清空会话状态（SessionEnd 表示会话真正结束）
+        try:
+            clear_session()
+            logger.info(f'会话状态已清空: {session_id}')
+        except Exception as e:
+            logger.warning(f'清空会话状态失败: {e}')
+        sys.exit(0)
+    except Exception:
+        # 任何异常都静默失败，不阻塞 Claude
+        logger.error('SessionEnd hook failed', exc_info=True)
+        sys.exit(0)
+if __name__ == '__main__':
+    main()

devlake_mcp/hooks/session_start.py ADDED Viewed

@@ -0,0 +1,81 @@
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+会话启动时记录会话信息（SessionStart Hook）
+功能：
+1. 调用 session_manager.start_new_session() 强制开始新会话
+   - SessionStart 语义：明确的"新会话开始"信号
+   - 无论如何都会结束旧会话并创建新会话（即使 session_id 相同）
+2. 异步执行，立即返回，不阻塞 Claude 启动
+注意：
+- 使用 start_new_session 而非 check_and_switch_session
+- SessionStart = 强制新建，UserPromptSubmit = 智能判断
+- 即使 SessionStart 未触发，UserPromptSubmit 也会创建 session（容错）
+"""
+import json
+import logging
+import sys
+import os
+from datetime import datetime
+from pathlib import Path
+# 导入公共工具（使用包导入）
+from devlake_mcp.hooks.hook_utils import run_async
+from devlake_mcp.session_manager import start_new_session
+from devlake_mcp.logging_config import configure_logging, get_log_dir
+from devlake_mcp.constants import HOOK_LOG_DIR
+# 配置日志（启动时调用一次）
+configure_logging(log_dir=get_log_dir(HOOK_LOG_DIR), log_file='session_start.log')
+logger = logging.getLogger(__name__)
+@run_async
+def main():
+    try:
+        # 1. 从 stdin 读取 hook 输入
+        input_data = json.load(sys.stdin)
+        session_id = input_data.get('session_id')
+        if not session_id:
+            logger.warning('缺少 session_id，跳过')
+            sys.exit(0)
+            return  # 确保退出（测试时 sys.exit 被 mock）
+        # 打印完整的 input_data 用于调试
+        logger.info(f'SessionStart Hook 触发 - session: {session_id}')
+        logger.debug(f'收到的 input_data: {json.dumps(input_data, ensure_ascii=False, indent=2)}')
+        # 2. 获取项目信息
+        # 注意：如果 cwd 是空字符串，也应该使用 os.getcwd()
+        raw_cwd = input_data.get('cwd')
+        logger.debug(f'input_data 中的 cwd 原始值: {repr(raw_cwd)}')
+        cwd = raw_cwd or os.getcwd()
+        logger.debug(f'最终使用的 cwd: {cwd}')
+        # 3. 强制开始新会话（SessionStart 语义 = 新会话开始）
+        try:
+            start_new_session(
+                session_id=session_id,
+                cwd=cwd,
+                ide_type='claude_code'
+            )
+            logger.info(f'SessionStart 完成 - session: {session_id}')
+        except Exception as e:
+            logger.error(f'会话管理失败: {e}')
+        # 成功，静默退出
+        sys.exit(0)
+    except Exception as e:
+        # 任何异常都静默失败，不阻塞 Claude
+        logger.error(f'SessionStart Hook 执行失败: {e}', exc_info=True)
+        sys.exit(0)
+if __name__ == '__main__':
+    main()

devlake_mcp/hooks/stop.py ADDED Viewed

@@ -0,0 +1,275 @@
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+创建完整的 Prompt 记录（Stop Hook）
+触发时机：Claude 完成一次回复时
+触发频率：每次 Claude 完成回复时触发一次
+功能：
+1. 从 transcript 解析用户 prompt 的完整信息（内容、提交时间、UUID等）
+2. 从 transcript 解析 Claude 响应信息（tokens、工具使用、结束时间等）
+3. 计算 prompt 序号
+4. 一次性创建完整的 prompt 记录（包含开始和结束信息）
+5. 增量更新 session 的 conversation_rounds
+6. 异步执行，立即返回，不阻塞 Claude 的下一次响应
+"""
+import json
+import logging
+import sys
+import os
+from pathlib import Path
+from datetime import datetime
+# 导入公共工具（使用包导入）
+from devlake_mcp.hooks.hook_utils import run_async
+from devlake_mcp.hooks.transcript_utils import (
+    parse_latest_response,
+    extract_tools_used,
+    trace_to_user_message,
+    get_user_message_by_uuid,
+    count_user_messages,
+    convert_to_utc_plus_8
+)
+from devlake_mcp.client import DevLakeClient
+from devlake_mcp.retry_queue import save_failed_upload
+from devlake_mcp.generation_manager import get_current_generation_id, end_generation
+from devlake_mcp.logging_config import configure_logging, get_log_dir
+from devlake_mcp.constants import HOOK_LOG_DIR
+# 配置日志（启动时调用一次）
+configure_logging(log_dir=get_log_dir(HOOK_LOG_DIR), log_file='stop_hook.log')
+logger = logging.getLogger(__name__)
+def extract_usage_data(latest_response: dict) -> dict:
+    """
+    从响应中提取完整的 usage 数据
+    Args:
+        latest_response: Claude 响应消息字典
+    Returns:
+        usage 数据字典，包含 input_tokens、cache tokens、output_tokens、model
+    """
+    usage = latest_response.get('usage', {})
+    # 提取所有 token 相关数据
+    usage_data = {
+        'input_tokens': usage.get('input_tokens', 0),
+        'output_tokens': usage.get('output_tokens', 0),
+        'cache_creation_input_tokens': usage.get('cache_creation_input_tokens', 0),
+        'cache_read_input_tokens': usage.get('cache_read_input_tokens', 0),
+        'model': latest_response.get('model')
+    }
+    logger.debug(f"提取的 usage 数据: {usage_data}")
+    return usage_data
+def extract_response_content(latest_response: dict) -> str:
+    """
+    提取响应内容的文本部分（摘要）
+    Args:
+        latest_response: Claude 响应消息字典
+    Returns:
+        响应内容摘要（前500字符）
+    """
+    response_content = ""
+    content = latest_response.get('content', [])
+    if isinstance(content, list):
+        for item in content:
+            if isinstance(item, dict) and item.get('type') == 'text':
+                text = item.get('text', '')
+                response_content = text[:500] if text else ""
+                break
+    return response_content
+def calculate_prompt_duration(user_message: dict, latest_response: dict) -> int:
+    """
+    计算 prompt 时长
+    Args:
+        user_message: 用户消息字典
+        latest_response: Claude 响应消息字典
+    Returns:
+        时长（秒），如果计算失败返回 None
+    """
+    try:
+        submit_time_str = user_message.get('timestamp')
+        end_time_str = latest_response.get('timestamp')
+        if not submit_time_str or not end_time_str:
+            return None
+        submit_time = datetime.fromisoformat(submit_time_str.replace('Z', '+00:00'))
+        end_time = datetime.fromisoformat(end_time_str.replace('Z', '+00:00'))
+        duration_delta = end_time - submit_time
+        return int(duration_delta.total_seconds())
+    except Exception as e:
+        logger.error(f'计算 prompt 时长失败: {e}')
+        return None
+@run_async
+def main():
+    try:
+        # 1. 从 stdin 读取 hook 输入
+        input_data = json.load(sys.stdin)
+        session_id = input_data.get('session_id')
+        transcript_path = input_data.get('transcript_path')
+        permission_mode = input_data.get('permission_mode')
+        logger.debug(f'Stop Hook 触发 - session: {session_id}, transcript: {transcript_path}')
+        if not session_id or not transcript_path:
+            logger.warning('缺少必要的 session_id 或 transcript_path')
+            sys.exit(0)
+        if not os.path.exists(transcript_path):
+            logger.info(f'Transcript 文件尚不存在（可能是新会话初始化）: {transcript_path}')
+            sys.exit(0)
+        # 2. 解析 transcript 获取最新的 Claude 响应
+        latest_response = parse_latest_response(transcript_path)
+        if not latest_response:
+            logger.warning('无法解析最新的 Claude 响应')
+            sys.exit(0)
+        logger.debug(f'最新响应 - uuid: {latest_response.get("uuid")}, '
+                    f'parent: {latest_response.get("parent_uuid")}, '
+                    f'output_tokens: {latest_response.get("usage", {}).get("output_tokens", 0)}')
+        # 3. 追溯到最初的 user 消息 UUID（处理 thinking 消息链）
+        parent_uuid = latest_response.get('parent_uuid')
+        if not parent_uuid:
+            logger.error('响应中缺少 parent_uuid')
+            sys.exit(0)
+        # 使用追溯函数找到真正的 user prompt UUID
+        prompt_uuid = trace_to_user_message(transcript_path, parent_uuid)
+        if not prompt_uuid:
+            logger.warning(f'无法追溯到 user 消息（从 {parent_uuid}），可能是工具调用等特殊情况')
+            sys.exit(0)
+        # 4. 获取完整的 user 消息信息
+        user_message = get_user_message_by_uuid(transcript_path, prompt_uuid)
+        if not user_message:
+            logger.error(f'无法获取 user 消息 (UUID: {prompt_uuid})')
+            sys.exit(0)
+        content_preview = user_message.get('content', '')[:100]
+        logger.debug(f'User 消息 - uuid: {prompt_uuid}, '
+                    f'timestamp: {user_message.get("timestamp")}, '
+                    f'content: {content_preview}...')
+        # 5. 提取响应信息
+        tools_used = extract_tools_used(latest_response)
+        usage_data = extract_usage_data(latest_response)
+        response_content = extract_response_content(latest_response)
+        is_interrupted = '[Request interrupted by user]' in str(latest_response.get('content', ''))
+        prompt_duration = calculate_prompt_duration(user_message, latest_response)
+        prompt_sequence = count_user_messages(transcript_path)
+        # 6. 检查是否有 generation_id（决定使用哪个 UUID）
+        generation_id = get_current_generation_id(session_id, ide_type='claude_code')
+        # 优先使用 generation_id 作为 prompt_uuid，否则使用 transcript 中的 UUID
+        final_prompt_uuid = generation_id if generation_id else prompt_uuid
+        logger.debug(f'UUID 选择 - generation_id: {generation_id}, transcript_uuid: {prompt_uuid}, final: {final_prompt_uuid}')
+        # 7. 构造完整的 prompt 数据（时区转换为 UTC+8）
+        prompt_data = {
+            'session_id': session_id,
+            'prompt_uuid': final_prompt_uuid,
+            'prompt_sequence': prompt_sequence,
+            'prompt_content': user_message.get('content', ''),
+            'prompt_submit_time': convert_to_utc_plus_8(user_message.get('timestamp')),
+            'prompt_end_time': convert_to_utc_plus_8(latest_response.get('timestamp')),
+            'prompt_duration': prompt_duration,
+            'response_content': response_content if response_content else None,
+            'response_tokens': usage_data['output_tokens'],
+            'input_tokens': usage_data['input_tokens'],
+            'cache_creation_input_tokens': usage_data['cache_creation_input_tokens'],
+            'cache_read_input_tokens': usage_data['cache_read_input_tokens'],
+            'model': usage_data['model'],
+            'tools_used': json.dumps(tools_used) if tools_used else None,
+            'cwd': user_message.get('cwd'),
+            'permission_mode': permission_mode or user_message.get('permission_mode'),
+            'is_interrupted': 1 if is_interrupted else 0
+        }
+        # 7. 决定创建还是更新
+        if generation_id:
+            # 情况 1：使用 generation_id（PATCH 更新）
+            # 注意：使用 generation_id 作为主键，但从 transcript 获取准确的响应信息
+            logger.info(f'准备更新 Prompt 记录: {generation_id}, sequence: {prompt_sequence}')
+            logger.debug(f'Prompt 更新数据: {json.dumps(prompt_data, ensure_ascii=False, default=str)}')
+            try:
+                client = DevLakeClient()
+                # 使用 generation_id 作为主键进行更新
+                client.update_prompt(generation_id, prompt_data)
+                logger.info(f'成功更新 Prompt 记录: {generation_id}')
+            except Exception as e:
+                logger.error(f'更新 Prompt 失败 ({generation_id}): {e}')
+                # 保存到本地队列（支持自动重试）
+                save_failed_upload(
+                    queue_type='prompt_update',
+                    data={'prompt_uuid': generation_id, **prompt_data},
+                    error=str(e)
+                )
+            # 结束 generation（清空状态）
+            end_generation(session_id, ide_type='claude_code')
+            logger.debug(f'Generation 已结束: {generation_id}')
+        else:
+            # 情况 2：向后兼容（POST 创建）
+            # 当没有 generation_id 时（例如旧版本或 Hook 未触发），创建新记录
+            logger.info(f'准备创建 Prompt 记录: {final_prompt_uuid}, sequence: {prompt_sequence} (向后兼容模式)')
+            logger.debug(f'Prompt 数据: {json.dumps(prompt_data, ensure_ascii=False, default=str)}')
+            try:
+                client = DevLakeClient()
+                client.create_prompt(prompt_data)
+                logger.info(f'成功创建 Prompt 记录: {final_prompt_uuid}')
+            except Exception as e:
+                logger.error(f'创建 Prompt 失败 ({final_prompt_uuid}): {e}')
+                # 保存到本地队列（支持自动重试）
+                save_failed_upload(
+                    queue_type='prompt',
+                    data=prompt_data,
+                    error=str(e)
+                )
+        # 9. 增量更新 session 的 conversation_rounds
+        try:
+            client = DevLakeClient()
+            client.increment_session_rounds(session_id)
+            logger.info(f'成功更新 session 对话轮数: {session_id}')
+        except Exception as e:
+            logger.error(f'更新 session 对话轮数失败 ({session_id}): {e}')
+            # 更新轮数失败不影响主流程，不保存到队列
+        # 成功，静默退出
+        sys.exit(0)
+    except Exception as e:
+        # 任何异常都静默失败，不阻塞 Claude
+        logger.error(f'Stop Hook 执行失败: {e}', exc_info=True)
+        sys.exit(0)
+if __name__ == '__main__':
+    main()