PyPI - auto-coder - Versions diffs - 0.1.400__py3-none-any.whl → 1.0.0__py3-none-any.whl - Mend

auto-coder 0.1.400py3-none-any.whl → 1.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of auto-coder might be problematic. Click here for more details.

Files changed (48) hide show

{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/METADATA +1 -1
{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/RECORD +48 -31
autocoder/agent/agentic_filter.py +1 -1
autocoder/agent/base_agentic/tools/read_file_tool_resolver.py +1 -1
autocoder/auto_coder_runner.py +120 -26
autocoder/chat_auto_coder.py +81 -22
autocoder/commands/auto_command.py +1 -1
autocoder/common/__init__.py +2 -2
autocoder/common/file_monitor/test_file_monitor.py +307 -0
autocoder/common/git_utils.py +7 -2
autocoder/common/pruner/__init__.py +0 -0
autocoder/common/pruner/agentic_conversation_pruner.py +197 -0
autocoder/common/pruner/context_pruner.py +574 -0
autocoder/common/pruner/conversation_pruner.py +132 -0
autocoder/common/pruner/test_agentic_conversation_pruner.py +342 -0
autocoder/common/pruner/test_context_pruner.py +546 -0
autocoder/common/tokens/__init__.py +15 -0
autocoder/common/tokens/counter.py +20 -0
autocoder/common/v2/agent/agentic_edit.py +372 -538
autocoder/common/v2/agent/agentic_edit_tools/__init__.py +8 -1
autocoder/common/v2/agent/agentic_edit_tools/ac_mod_read_tool_resolver.py +40 -0
autocoder/common/v2/agent/agentic_edit_tools/ac_mod_write_tool_resolver.py +43 -0
autocoder/common/v2/agent/agentic_edit_tools/ask_followup_question_tool_resolver.py +8 -0
autocoder/common/v2/agent/agentic_edit_tools/execute_command_tool_resolver.py +1 -1
autocoder/common/v2/agent/agentic_edit_tools/read_file_tool_resolver.py +1 -1
autocoder/common/v2/agent/agentic_edit_tools/search_files_tool_resolver.py +33 -88
autocoder/common/v2/agent/agentic_edit_tools/test_write_to_file_tool_resolver.py +8 -8
autocoder/common/v2/agent/agentic_edit_tools/todo_read_tool_resolver.py +118 -0
autocoder/common/v2/agent/agentic_edit_tools/todo_write_tool_resolver.py +324 -0
autocoder/common/v2/agent/agentic_edit_types.py +46 -4
autocoder/common/v2/agent/runner/__init__.py +31 -0
autocoder/common/v2/agent/runner/base_runner.py +106 -0
autocoder/common/v2/agent/runner/event_runner.py +216 -0
autocoder/common/v2/agent/runner/sdk_runner.py +40 -0
autocoder/common/v2/agent/runner/terminal_runner.py +283 -0
autocoder/common/v2/agent/runner/tool_display.py +191 -0
autocoder/index/entry.py +1 -1
autocoder/plugins/token_helper_plugin.py +107 -7
autocoder/run_context.py +9 -0
autocoder/sdk/__init__.py +114 -81
autocoder/sdk/cli/main.py +5 -0
autocoder/sdk/core/auto_coder_core.py +0 -158
autocoder/sdk/core/bridge.py +2 -4
autocoder/version.py +1 -1
{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/WHEEL +0 -0
{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/entry_points.txt +0 -0
{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/licenses/LICENSE +0 -0
{auto_coder-0.1.400.dist-info → auto_coder-1.0.0.dist-info}/top_level.txt +0 -0

autocoder/common/pruner/context_pruner.py ADDED Viewed

@@ -0,0 +1,574 @@
+from typing import List, Dict, Any, Union
+from typing import Tuple
+from pathlib import Path
+import json
+from loguru import logger
+from autocoder.common.tokens import count_string_tokens as count_tokens
+from autocoder.common import AutoCoderArgs, SourceCode
+from byzerllm.utils.client.code_utils import extract_code
+from autocoder.index.types import VerifyFileRelevance
+import byzerllm
+from concurrent.futures import ThreadPoolExecutor, as_completed
+from autocoder.common.printer import Printer
+from autocoder.common.auto_coder_lang import get_message_with_format
+class PruneContext:
+    def __init__(self, max_tokens: int, args: AutoCoderArgs, llm: Union[byzerllm.ByzerLLM, byzerllm.SimpleByzerLLM], verbose: bool = False):
+        self.max_tokens = max_tokens
+        self.args = args
+        self.llm = llm
+        self.printer = Printer()
+        self.verbose = verbose
+    def _split_content_with_sliding_window(self, content: str, window_size=100, overlap=20) -> List[Tuple[int, int, str]]:
+        """使用滑动窗口分割大文件内容，返回包含行号信息的文本块
+        Args:
+            content: 要分割的文件内容
+            window_size: 每个窗口包含的行数
+            overlap: 相邻窗口的重叠行数
+        Returns:
+            List[Tuple[int, int, str]]: 返回元组列表，每个元组包含:
+                - 起始行号(从1开始)，在原始文件的绝对行号
+                - 结束行号，在原始文件的绝对行号
+                - 带行号的内容文本
+        """
+        # 按行分割内容
+        lines = content.splitlines()
+        chunks = []
+        start = 0
+        while start < len(lines):
+            # 计算当前窗口的结束位置
+            end = min(start + window_size, len(lines))
+            # 计算实际的起始位置(考虑重叠)
+            actual_start = max(0, start - overlap)
+            # 提取当前窗口的行
+            chunk_lines = lines[actual_start:end]
+            # 为每一行添加行号
+            # 行号从actual_start+1开始，保持与原文件的绝对行号一致
+            chunk_content = "\n".join([
+                f"{i+1} {line}" for i, line in enumerate(chunk_lines, start=actual_start)
+            ])
+            # 保存分块信息：(起始行号, 结束行号, 带行号的内容)
+            # 行号从1开始计数
+            chunks.append((actual_start + 1, end, chunk_content))
+            # 移动到下一个窗口的起始位置
+            # 减去overlap确保窗口重叠
+            start += (window_size - overlap)
+        return chunks
+    def _delete_overflow_files(self, file_sources: List[SourceCode]) -> List[SourceCode]:
+        """直接删除超出 token 限制的文件"""
+        total_tokens = 0
+        selected_files = []
+        token_count = 0
+        for file_source in file_sources:
+            try:
+                token_count = file_source.tokens
+                if token_count <= 0:
+                    token_count = count_tokens(file_source.source_code)
+                if total_tokens + token_count <= self.max_tokens:
+                    total_tokens += token_count
+                    print(f"{file_source.module_name} {token_count}")
+                    selected_files.append(file_source)
+                else:
+                    break
+            except Exception as e:
+                logger.error(f"Failed to read file {file_source.module_name}: {e}")
+                selected_files.append(file_source)
+        return selected_files
+    def _extract_code_snippets(self, file_sources: List[SourceCode], conversations: List[Dict[str, str]]) -> List[SourceCode]:
+        """抽取关键代码片段策略"""
+        token_count = 0
+        selected_files = []
+        full_file_tokens = int(self.max_tokens * 0.8)
+        if self.verbose:
+            total_input_tokens = sum(f.tokens for f in file_sources)
+            self.printer.print_str_in_terminal(f"🚀 开始代码片段抽取处理，共 {len(file_sources)} 个文件，总token数: {total_input_tokens}")
+            self.printer.print_str_in_terminal(f"📋 处理策略: 完整文件优先阈值={full_file_tokens}, 最大token限制={self.max_tokens}")
+        @byzerllm.prompt()
+        def extract_code_snippets(conversations: List[Dict[str, str]], content: str, is_partial_content: bool = False) -> str:
+            """
+            根据提供的代码文件和对话历史提取相关代码片段。
+            处理示例：
+            <examples>
+            1.  代码文件：
+            <code_file>
+                1 def add(a, b):
+                2     return a + b
+                3 def sub(a, b):
+                4     return a - b
+            </code_file>
+            <conversation_history>
+                <user>: 如何实现加法？
+            </conversation_history>
+            输出：
+            ```json
+            [
+                {"start_line": 1, "end_line": 2}
+            ]
+            ```
+            2.  代码文件：
+                1 class User:
+                2     def __init__(self, name):
+                3         self.name = name
+                4     def greet(self):
+                5         return f"Hello, {self.name}"
+            </code_file>
+            <conversation_history>
+                <user>: 如何创建一个User对象？
+            </conversation_history>
+            输出：
+            ```json
+            [
+                {"start_line": 1, "end_line": 3}
+            ]
+            ```
+            3.  代码文件：
+            <code_file>
+                1 def foo():
+                2     pass
+            </code_file>
+            <conversation_history>
+                <user>: 如何实现减法？
+            </conversation_history>
+            输出：
+            ```json
+            []
+            ```
+            </examples>
+            输入:
+            1. 代码文件内容:
+            <code_file>
+            {{ content }}
+            </code_file>
+            <% if is_partial_content: %>
+            <partial_content_process_note>
+            当前处理的是文件的局部内容（行号{start_line}-{end_line}），
+            请仅基于当前可见内容判断相关性，返回标注的行号区间。
+            </partial_content_process_note>
+            <% endif %>
+            2. 对话历史:
+            <conversation_history>
+            {% for msg in conversations %}
+            <{{ msg.role }}>: {{ msg.content }}
+            {% endfor %}
+            </conversation_history>
+            任务:
+            1. 分析最后一个用户问题及其上下文。
+            2. 在代码文件中找出与问题相关的一个或多个重要代码段。
+            3. 对每个相关代码段，确定其起始行号(start_line)和结束行号(end_line)。
+            4. 代码段数量不超过4个。
+            输出要求:
+            1. 返回一个JSON数组，每个元素包含"start_line"和"end_line"。
+            2. start_line和end_line必须是整数，表示代码文件中的行号。
+            3. 行号从1开始计数。
+            4. 如果没有相关代码段，返回空数组[]。
+            输出格式:
+            严格的JSON数组，不包含其他文字或解释。
+            ```json
+            [
+                {"start_line": 第一个代码段的起始行号, "end_line": 第一个代码段的结束行号},
+                {"start_line": 第二个代码段的起始行号, "end_line": 第二个代码段的结束行号}
+            ]
+            ```
+            """
+        for file_source in file_sources:
+            try:
+                # 完整文件优先
+                tokens = file_source.tokens
+                if token_count + tokens <= full_file_tokens:
+                    selected_files.append(SourceCode(
+                        module_name=file_source.module_name, source_code=file_source.source_code, tokens=tokens))
+                    token_count += tokens
+                    if self.verbose:
+                        self.printer.print_str_in_terminal(f"✅ 文件 {file_source.module_name} 完整保留 (token数: {tokens}，当前总token数: {token_count})")
+                    continue
+                # 如果单个文件太大，那么先按滑动窗口分割，然后对窗口抽取代码片段
+                if tokens > self.max_tokens:
+                    self.printer.print_in_terminal(
+                        "file_sliding_window_processing", file_path=file_source.module_name, tokens=tokens)
+                    chunks = self._split_content_with_sliding_window(file_source.source_code,
+                                                                        self.args.context_prune_sliding_window_size,
+                                                                        self.args.context_prune_sliding_window_overlap)
+                    if self.verbose:
+                        self.printer.print_str_in_terminal(f"📊 文件 {file_source.module_name} 通过滑动窗口分割为 {len(chunks)} 个chunks")
+                    all_snippets = []
+                    chunk_with_results = 0
+                    for chunk_idx, (chunk_start, chunk_end, chunk_content) in enumerate(chunks):
+                        if self.verbose:
+                            self.printer.print_str_in_terminal(f"  🔍 处理chunk {chunk_idx + 1}/{len(chunks)} (行号: {chunk_start}-{chunk_end})")
+                        extracted = extract_code_snippets.with_llm(self.llm).run(
+                            conversations=conversations,
+                            content=chunk_content,
+                            is_partial_content=True
+                        )
+                        if extracted:
+                            json_str = extract_code(extracted)[0][1]
+                            snippets = json.loads(json_str)
+                            if snippets:  # 有抽取结果
+                                chunk_with_results += 1
+                                if self.verbose:
+                                    self.printer.print_str_in_terminal(f"    ✅ chunk {chunk_idx + 1} 抽取到 {len(snippets)} 个代码片段: {snippets}")
+                                # 获取到的本来就是在原始文件里的绝对行号
+                                # 后续在构建代码片段内容时，会为了适配数组操作修改行号，这里无需处理
+                                adjusted_snippets = [{
+                                    "start_line": snippet["start_line"],
+                                    "end_line": snippet["end_line"]
+                                } for snippet in snippets]
+                                all_snippets.extend(adjusted_snippets)
+                            else:
+                                if self.verbose:
+                                    self.printer.print_str_in_terminal(f"    ❌ chunk {chunk_idx + 1} 未抽取到相关代码片段")
+                        else:
+                            if self.verbose:
+                                self.printer.print_str_in_terminal(f"    ❌ chunk {chunk_idx + 1} 抽取失败，未返回结果")
+                    if self.verbose:
+                        self.printer.print_str_in_terminal(f"📈 滑动窗口处理完成: {chunk_with_results}/{len(chunks)} 个chunks有抽取结果，共收集到 {len(all_snippets)} 个代码片段")
+                    merged_snippets = self._merge_overlapping_snippets(all_snippets)
+                    if self.verbose:
+                        self.printer.print_str_in_terminal(f"🔄 合并重叠片段: {len(all_snippets)} -> {len(merged_snippets)} 个片段")
+                        if merged_snippets:
+                            self.printer.print_str_in_terminal(f"    合并后的片段: {merged_snippets}")
+                    # 只有当有代码片段时才处理
+                    if merged_snippets:
+                        content_snippets = self._build_snippet_content(
+                            file_source.module_name, file_source.source_code, merged_snippets)
+                        snippet_tokens = count_tokens(content_snippets)
+                        if token_count + snippet_tokens <= self.max_tokens:
+                            selected_files.append(SourceCode(
+                                module_name=file_source.module_name, source_code=content_snippets, tokens=snippet_tokens))
+                            token_count += snippet_tokens
+                            self.printer.print_in_terminal("file_snippet_procesed", file_path=file_source.module_name,
+                                                            total_tokens=token_count,
+                                                            tokens=tokens,
+                                                            snippet_tokens=snippet_tokens)
+                            if self.verbose:
+                                self.printer.print_str_in_terminal(f"✅ 文件 {file_source.module_name} 滑动窗口处理成功，最终抽取到结果")
+                            continue
+                        else:
+                            if self.verbose:
+                                self.printer.print_str_in_terminal(f"❌ 文件 {file_source.module_name} 滑动窗口处理后token数超限 ({token_count + snippet_tokens} > {self.max_tokens})，停止处理")
+                            break
+                    else:
+                        # 滑动窗口处理后没有相关代码片段，跳过这个文件
+                        if self.verbose:
+                            self.printer.print_str_in_terminal(f"⏭️ 文件 {file_source.module_name} 滑动窗口处理后无相关代码片段，跳过处理")
+                        continue
+                # 抽取关键片段
+                lines = file_source.source_code.splitlines()
+                new_content = ""
+                # 将文件内容按行编号
+                for index, line in enumerate(lines):
+                    new_content += f"{index+1} {line}\n"
+                # 抽取代码片段
+                self.printer.print_in_terminal(
+                    "file_snippet_processing", file_path=file_source.module_name)
+                if self.verbose:
+                    self.printer.print_str_in_terminal(f"🔍 开始对文件 {file_source.module_name} 进行整体代码片段抽取 (共 {len(lines)} 行)")
+                extracted = extract_code_snippets.with_llm(self.llm).run(
+                    conversations=conversations,
+                    content=new_content
+                )
+                # 构建代码片段内容
+                if extracted:
+                    json_str = extract_code(extracted)[0][1]
+                    snippets = json.loads(json_str)
+                    if self.verbose:
+                        if snippets:
+                            self.printer.print_str_in_terminal(f"    ✅ 抽取到 {len(snippets)} 个代码片段: {snippets}")
+                        else:
+                            self.printer.print_str_in_terminal(f"    ❌ 未抽取到相关代码片段")
+                    # 只有当有代码片段时才处理
+                    if snippets:
+                        content_snippets = self._build_snippet_content(
+                            file_source.module_name, file_source.source_code, snippets)
+                        snippet_tokens = count_tokens(content_snippets)
+                        if token_count + snippet_tokens <= self.max_tokens:
+                            selected_files.append(SourceCode(module_name=file_source.module_name,
+                                                                source_code=content_snippets,
+                                                                tokens=snippet_tokens))
+                            token_count += snippet_tokens
+                            self.printer.print_in_terminal("file_snippet_procesed", file_path=file_source.module_name,
+                                                            total_tokens=token_count,
+                                                            tokens=tokens,
+                                                            snippet_tokens=snippet_tokens)
+                            if self.verbose:
+                                self.printer.print_str_in_terminal(f"✅ 文件 {file_source.module_name} 整体抽取成功，最终抽取到结果")
+                        else:
+                            if self.verbose:
+                                self.printer.print_str_in_terminal(f"❌ 文件 {file_source.module_name} 整体抽取后token数超限 ({token_count + snippet_tokens} > {self.max_tokens})，停止处理")
+                            break
+                    else:
+                        # 没有相关代码片段，跳过这个文件
+                        if self.verbose:
+                            self.printer.print_str_in_terminal(f"⏭️ 文件 {file_source.module_name} 无相关代码片段，跳过处理")
+                else:
+                    if self.verbose:
+                        self.printer.print_str_in_terminal(f"❌ 文件 {file_source.module_name} 整体抽取失败，未返回结果")
+            except Exception as e:
+                logger.error(f"Failed to process {file_source.module_name}: {e}")
+                if self.verbose:
+                    self.printer.print_str_in_terminal(f"❌ 文件 {file_source.module_name} 处理异常: {e}")
+                continue
+        if self.verbose:
+            total_input_tokens = sum(f.tokens for f in file_sources)
+            final_tokens = sum(f.tokens for f in selected_files)
+            self.printer.print_str_in_terminal(f"🎯 代码片段抽取处理完成")
+            self.printer.print_str_in_terminal(f"📊 处理结果统计:")
+            self.printer.print_str_in_terminal(f"   • 输入文件数: {len(file_sources)} 个，输入token数: {total_input_tokens}")
+            self.printer.print_str_in_terminal(f"   • 输出文件数: {len(selected_files)} 个，输出token数: {final_tokens}")
+            self.printer.print_str_in_terminal(f"   • Token压缩率: {((total_input_tokens - final_tokens) / total_input_tokens * 100):.1f}%")
+            # 统计各种处理方式的文件数量
+            complete_files = 0
+            snippet_files = 0
+            for i, file_source in enumerate(file_sources):
+                if i < len(selected_files):
+                    if selected_files[i].source_code == file_source.source_code:
+                        complete_files += 1
+                    else:
+                        snippet_files += 1
+            self.printer.print_str_in_terminal(f"   • 完整保留文件: {complete_files} 个")
+            self.printer.print_str_in_terminal(f"   • 片段抽取文件: {snippet_files} 个")
+            self.printer.print_str_in_terminal(f"   • 跳过处理文件: {len(file_sources) - len(selected_files)} 个")
+        return selected_files
+    def _merge_overlapping_snippets(self, snippets: List[dict]) -> List[dict]:
+        if not snippets:
+            return []
+        # 按起始行排序
+        sorted_snippets = sorted(snippets, key=lambda x: x["start_line"])
+        merged = [sorted_snippets[0]]
+        for current in sorted_snippets[1:]:
+            last = merged[-1]
+            if current["start_line"] <= last["end_line"] + 1:  # 允许1行间隔
+                # 合并区间
+                merged[-1] = {
+                    "start_line": min(last["start_line"], current["start_line"]),
+                    "end_line": max(last["end_line"], current["end_line"])
+                }
+            else:
+                merged.append(current)
+        return merged
+    def _build_snippet_content(self, file_path: str, full_content: str, snippets: List[dict]) -> str:
+        """构建包含代码片段的文件内容"""
+        lines = full_content.splitlines()
+        header = f"Snippets:\n"
+        content = []
+        for snippet in snippets:
+            start = max(0, snippet["start_line"] - 1)
+            end = min(len(lines), snippet["end_line"])
+            content.append(
+                f"# Lines {start+1}-{end} ({snippet.get('reason','')})")
+            content.extend(lines[start:end])
+        return header + "\n".join(content)
+    def handle_overflow(
+        self,
+        file_sources: List[SourceCode],
+        conversations: List[Dict[str, str]],
+        strategy: str = "score"
+    ) -> List[SourceCode]:
+        """
+        处理超出 token 限制的文件
+        :param file_sources: 要处理的文件
+        :param conversations: 对话上下文（用于提取策略）
+        :param strategy: 处理策略 (delete/extract/score)
+        """
+        file_paths = [file_source.module_name for file_source in file_sources]
+        total_tokens, sources = self._count_tokens(file_sources=file_sources)
+        if total_tokens <= self.max_tokens:
+            return sources
+        self.printer.print_in_terminal(
+            "context_pruning_reason",
+            total_tokens=total_tokens,
+            max_tokens=self.max_tokens,
+            style="yellow"
+        )
+        self.printer.print_in_terminal(
+            "sorted_files_message",
+            files=file_paths
+        )
+        self.printer.print_in_terminal(
+            "context_pruning_start",
+            total_tokens=total_tokens,
+            max_tokens=self.max_tokens,
+            strategy=strategy
+        )
+        if strategy == "score":
+            return self._score_and_filter_files(sources, conversations)
+        if strategy == "delete":
+            return self._delete_overflow_files(sources)
+        elif strategy == "extract":
+            return self._extract_code_snippets(sources, conversations)
+        else:
+            raise ValueError(f"无效策略: {strategy}. 可选值: delete/extract/score")
+    def _count_tokens(self, file_sources: List[SourceCode]) -> Tuple[int, List[SourceCode]]:
+        """计算文件总token数"""
+        total_tokens = 0
+        sources = []
+        for file_source in file_sources:
+            try:
+                if file_source.tokens > 0:
+                    tokens = file_source.tokens
+                    total_tokens += file_source.tokens
+                else:
+                    tokens = count_tokens(file_source.source_code)
+                    total_tokens += tokens
+                sources.append(SourceCode(module_name=file_source.module_name,
+                                   source_code=file_source.source_code, tokens=tokens))
+            except Exception as e:
+                logger.error(f"Failed to count tokens for {file_source.module_name}: {e}")
+                sources.append(SourceCode(module_name=file_source.module_name,
+                                   source_code=file_source.source_code, tokens=0))
+        return total_tokens, sources
+    def _score_and_filter_files(self, file_sources: List[SourceCode], conversations: List[Dict[str, str]]) -> List[SourceCode]:
+        """根据文件相关性评分过滤文件，直到token数大于max_tokens 停止追加"""
+        selected_files = []
+        total_tokens = 0
+        scored_files = []
+        @byzerllm.prompt()
+        def verify_file_relevance(file_content: str, conversations: List[Dict[str, str]]) -> str:
+            """
+            请验证下面的文件内容是否与用户对话相关:
+            文件内容:
+            {{ file_content }}
+            历史对话:
+            <conversation_history>
+            {% for msg in conversations %}
+            <{{ msg.role }}>: {{ msg.content }}
+            {% endfor %}
+            </conversation_history>
+            相关是指，需要依赖这个文件提供上下文，或者需要修改这个文件才能解决用户的问题。
+            请给出相应的可能性分数：0-10，并结合用户问题，理由控制在50字以内。格式如下:
+            ```json
+            {
+                "relevant_score": 0-10,
+                "reason": "这是相关的原因（不超过10个中文字符）..."
+            }
+            ```
+            """
+        def _score_file(file_source: SourceCode) -> dict:
+            try:
+                result = verify_file_relevance.with_llm(self.llm).with_return_type(VerifyFileRelevance).run(
+                    file_content=file_source.source_code,
+                    conversations=conversations
+                )
+                return {
+                    "file_path": file_source.module_name,
+                    "score": result.relevant_score,
+                    "tokens": file_source.tokens,
+                    "content": file_source.source_code
+                }
+            except Exception as e:
+                logger.error(f"Failed to score file {file_source.module_name}: {e}")
+                return None
+        # 使用线程池并行打分
+        with ThreadPoolExecutor() as executor:
+            futures = [executor.submit(_score_file, file_source)
+                       for file_source in file_sources]
+            for future in as_completed(futures):
+                result = future.result()
+                if result:
+                    self.printer.print_str_in_terminal(
+                        get_message_with_format(
+                            "file_scored_message",
+                            file_path=result["file_path"],
+                            score=result["score"]
+                        )
+                    )
+                    scored_files.append(result)
+        # 第二步：按分数从高到低排序
+        scored_files.sort(key=lambda x: x["score"], reverse=True)
+        # 第三步：从高分开始过滤，直到token数大于max_tokens 停止追加
+        for file_info in scored_files:
+            if total_tokens + file_info["tokens"] <= self.max_tokens:
+                selected_files.append(SourceCode(
+                    module_name=file_info["file_path"],
+                    source_code=file_info["content"],
+                    tokens=file_info["tokens"]
+                ))
+                total_tokens += file_info["tokens"]
+            else:
+                break
+        return selected_files

auto-coder 0.1.400__py3-none-any.whl → 1.0.0__py3-none-any.whl

Potentially problematic release.

auto-coder 0.1.400py3-none-any.whl → 1.0.0py3-none-any.whl