PyPI - auto-coder - Versions diffs - 0.1.255__py3-none-any.whl → 0.1.257__py3-none-any.whl - Mend

auto-coder 0.1.255py3-none-any.whl → 0.1.257py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of auto-coder might be problematic. Click here for more details.

Files changed (30) hide show

{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/METADATA +2 -2
{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/RECORD +30 -27
autocoder/auto_coder.py +44 -50
autocoder/chat_auto_coder.py +16 -17
autocoder/chat_auto_coder_lang.py +1 -1
autocoder/common/__init__.py +7 -0
autocoder/common/auto_coder_lang.py +46 -16
autocoder/common/code_auto_generate.py +45 -5
autocoder/common/code_auto_generate_diff.py +45 -7
autocoder/common/code_auto_generate_editblock.py +48 -4
autocoder/common/code_auto_generate_strict_diff.py +46 -7
autocoder/common/code_modification_ranker.py +39 -3
autocoder/dispacher/actions/action.py +60 -40
autocoder/dispacher/actions/plugins/action_regex_project.py +12 -6
autocoder/index/entry.py +6 -4
autocoder/index/filter/quick_filter.py +175 -65
autocoder/index/index.py +94 -4
autocoder/models.py +44 -6
autocoder/privacy/__init__.py +3 -0
autocoder/privacy/model_filter.py +100 -0
autocoder/pyproject/__init__.py +1 -0
autocoder/suffixproject/__init__.py +1 -0
autocoder/tsproject/__init__.py +1 -0
autocoder/utils/llms.py +27 -0
autocoder/utils/model_provider_selector.py +192 -0
autocoder/version.py +1 -1
{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/LICENSE +0 -0
{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/WHEEL +0 -0
{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/entry_points.txt +0 -0
{auto_coder-0.1.255.dist-info → auto_coder-0.1.257.dist-info}/top_level.txt +0 -0

autocoder/dispacher/actions/plugins/action_regex_project.py CHANGED Viewed

@@ -15,6 +15,7 @@ from autocoder.utils.conversation_store import store_code_model_conversation
 from autocoder.common.printer import Printer
 import time
 from autocoder.utils.llms import get_llm_names
+from autocoder.common import SourceCodeList
 from loguru import logger
 class ActionRegexProject:
     def __init__(
@@ -36,20 +37,21 @@ class ActionRegexProject:
         pp = RegexProject(args=args, llm=self.llm)
         self.pp = pp
         pp.run()
-        source_code = pp.output()
+        source_code_list = SourceCodeList(pp.sources)
         if self.llm:
             if args.in_code_apply:
                 old_query = args.query
                 args.query = (args.context or "") + "\n\n" + args.query
-            source_code = build_index_and_filter_files(
+            source_code_list = build_index_and_filter_files(
                 llm=self.llm, args=args, sources=pp.sources
             )
             if args.in_code_apply:
                 args.query = old_query
-        self.process_content(source_code)
+        self.process_content(source_code_list)
-    def process_content(self, content: str):
+    def process_content(self, source_code_list: SourceCodeList):
         args = self.args
+        content = source_code_list.to_str()
         if args.execute and self.llm and not args.human_as_model:
             if len(content) > self.args.model_max_input_length:
@@ -78,21 +80,25 @@ class ActionRegexProject:
                 generate = CodeAutoGenerate(llm=self.llm, args=self.args, action=self)
             if self.args.enable_multi_round_generate:
                 generate_result = generate.multi_round_run(
-                    query=args.query, source_content=content
+                    query=args.query, source_code_list=source_code_list
                 )
             else:
                 generate_result = generate.single_round_run(
-                    query=args.query, source_content=content
+                    query=args.query, source_code_list=source_code_list
                 )
             elapsed_time = time.time() - start_time
             speed = generate_result.metadata.get('generated_tokens_count', 0) / elapsed_time if elapsed_time > 0 else 0
             model_names = ",".join(get_llm_names(self.llm))
+            input_tokens_cost = generate_result.metadata.get('input_tokens_cost', 0)
+            generated_tokens_cost = generate_result.metadata.get('generated_tokens_cost', 0)
             self.printer.print_in_terminal(
                 "code_generation_complete",
                 duration=elapsed_time,
                 input_tokens=generate_result.metadata.get('input_tokens_count', 0),
                 output_tokens=generate_result.metadata.get('generated_tokens_count', 0),
+                input_cost=input_tokens_cost,
+                output_cost=generated_tokens_cost,
                 speed=round(speed, 2),
                 model_names=model_names
             )

autocoder/index/entry.py CHANGED Viewed

@@ -23,10 +23,11 @@ from autocoder.index.filter.quick_filter import QuickFilter
 from autocoder.index.filter.normal_filter import NormalFilter
 from autocoder.index.index import IndexManager
 from loguru import logger
+from autocoder.common import SourceCodeList
 def build_index_and_filter_files(
     llm, args: AutoCoderArgs, sources: List[SourceCode]
-) -> str:
+) -> SourceCodeList:
     # Initialize timing and statistics
     total_start_time = time.monotonic()
     stats = {
@@ -253,7 +254,8 @@ def build_index_and_filter_files(
         for file in final_filenames:
             print(f"{file} - {final_files[file].reason}")
-    source_code = ""
+    source_code = ""
+    source_code_list = SourceCodeList(sources=[])
     depulicated_sources = set()
     for file in sources:
@@ -263,7 +265,7 @@ def build_index_and_filter_files(
             depulicated_sources.add(file.module_name)
             source_code += f"##File: {file.module_name}\n"
             source_code += f"{file.source_code}\n\n"
+            source_code_list.sources.append(file)
     if args.request_id and not args.skip_events:
         queue_communicate.send_event(
             request_id=args.request_id,
@@ -339,4 +341,4 @@ def build_index_and_filter_files(
             )
         )
-    return source_code
+    return source_code_list

autocoder/index/filter/quick_filter.py CHANGED Viewed

@@ -4,21 +4,21 @@ from autocoder.utils.auto_coder_utils.chat_stream_out import stream_out
 from autocoder.common.utils_code_auto_generate import stream_chat_with_continue
 from byzerllm.utils.str2model import to_model
 from autocoder.index.types import IndexItem
-from autocoder.common import AutoCoderArgs,SourceCode
+from autocoder.common import AutoCoderArgs, SourceCode
 import byzerllm
 import time
 from autocoder.index.index import IndexManager
 from autocoder.index.types import (
     IndexItem,
-    TargetFile,
+    TargetFile,
     FileNumberList
 )
 from autocoder.rag.token_counter import count_tokens
 from autocoder.common.printer import Printer
 from concurrent.futures import ThreadPoolExecutor
-import threading
+from byzerllm import MetaHolder
-from autocoder.utils.llms import get_llm_names
+from autocoder.utils.llms import get_llm_names, get_model_info
 def get_file_path(file_path):
@@ -32,8 +32,9 @@ class QuickFilterResult(BaseModel):
     has_error: bool
     error_message: Optional[str] = None
 class QuickFilter():
-    def __init__(self, index_manager: IndexManager,stats:Dict[str,Any],sources:List[SourceCode]):
+    def __init__(self, index_manager: IndexManager, stats: Dict[str, Any], sources: List[SourceCode]):
         self.index_manager = index_manager
         self.args = index_manager.args
         self.stats = stats
@@ -41,72 +42,142 @@ class QuickFilter():
         self.printer = Printer()
         self.max_tokens = self.args.index_filter_model_max_input_length
     def big_filter(self, index_items: List[IndexItem],) -> QuickFilterResult:
         chunks = []
         current_chunk = []
         # 将 index_items 切分成多个 chunks,第一个chunk尽可能接近max_tokens
         for item in index_items:
             # 使用 quick_filter_files.prompt 生成文本再统计
             temp_chunk = current_chunk + [item]
-            prompt_text = self.quick_filter_files.prompt(temp_chunk, self.args.query)
-            temp_size = count_tokens(prompt_text)
+            prompt_text = self.quick_filter_files.prompt(
+                temp_chunk, self.args.query)
+            temp_size = count_tokens(prompt_text)
             # 如果当前chunk为空,或者添加item后不超过max_tokens,就添加到当前chunk
             if not current_chunk or temp_size <= self.max_tokens:
-                current_chunk.append(item)
+                current_chunk.append(item)
             else:
                 # 当前chunk已满,创建新chunk
                 chunks.append(current_chunk)
-                current_chunk = [item]
+                current_chunk = [item]
         if current_chunk:
             chunks.append(current_chunk)
-        tokens_len = count_tokens(self.quick_filter_files.prompt(index_items, self.args.query))
+        tokens_len = count_tokens(
+            self.quick_filter_files.prompt(index_items, self.args.query))
         self.printer.print_in_terminal(
-                "quick_filter_too_long",
-                style="yellow",
-                tokens_len=tokens_len,
-                max_tokens=self.max_tokens,
-                split_size=len(chunks)
-            )
+            "quick_filter_too_long",
+            style="yellow",
+            tokens_len=tokens_len,
+            max_tokens=self.max_tokens,
+            split_size=len(chunks)
+        )
         def process_chunk(chunk_index: int, chunk: List[IndexItem]) -> QuickFilterResult:
             try:
-                model_name = ",".join(get_llm_names(self.index_manager.index_filter_llm))
+                # 获取模型名称列表
+                model_names = get_llm_names(
+                    self.index_manager.index_filter_llm)
+                model_name = ",".join(model_names)
                 files: Dict[str, TargetFile] = {}
+                # 获取模型价格信息
+                model_info_map = {}
+                for name in model_names:
+                    # 第二个参数是产品模式,从args中获取
+                    info = get_model_info(name, self.args.product_mode)
+                    if info:
+                        model_info_map[name] = {
+                            # 每百万tokens成本
+                            "input_price": info.get("input_price", 0.0),
+                            # 每百万tokens成本
+                            "output_price": info.get("output_price", 0.0)
+                        }
                 if chunk_index == 0:
                     # 第一个chunk使用流式输出
                     stream_generator = stream_chat_with_continue(
                         self.index_manager.index_filter_llm,
-                        [{"role": "user", "content": self.quick_filter_files.prompt(chunk, self.args.query)}],
+                        [{"role": "user", "content": self.quick_filter_files.prompt(
+                            chunk, self.args.query)}],
                         {}
                     )
-                    full_response, _ = stream_out(
+                    full_response, last_meta = stream_out(
                         stream_generator,
                         model_name=model_name,
-                        title=self.printer.get_message_from_key_with_format("quick_filter_title", model_name=model_name),
+                        title=self.printer.get_message_from_key_with_format(
+                            "quick_filter_title", model_name=model_name),
                         args=self.args
                     )
                     file_number_list = to_model(full_response, FileNumberList)
+                    # 计算总成本
+                    total_input_cost = 0.0
+                    total_output_cost = 0.0
+                    for name in model_names:
+                        info = model_info_map.get(name, {})
+                        # 计算公式:token数 * 单价 / 1000000
+                        total_input_cost += (last_meta.input_tokens_count *
+                                             info.get("input_price", 0.0)) / 1000000
+                        total_output_cost += (last_meta.generated_tokens_count *
+                                              info.get("output_price", 0.0)) / 1000000
+                    # 四舍五入到4位小数
+                    total_input_cost = round(total_input_cost, 4)
+                    total_output_cost = round(total_output_cost, 4)
+                    # 打印 token 统计信息和成本
+                    self.printer.print_in_terminal(
+                        "quick_filter_stats",
+                        style="blue",
+                        input_tokens=last_meta.input_tokens_count,
+                        output_tokens=last_meta.generated_tokens_count,
+                        input_cost=total_input_cost,
+                        output_cost=total_output_cost,
+                        model_names=model_name
+                    )
                 else:
                     # 其他chunks直接使用with_llm
-                    file_number_list = self.quick_filter_files.with_llm(self.index_manager.index_filter_llm).with_return_type(FileNumberList).run(chunk, self.args.query)
+                    meta_holder = MetaHolder()
+                    start_time = time.monotonic()
+                    file_number_list = self.quick_filter_files.with_llm(self.index_manager.index_filter_llm).with_meta(
+                        meta_holder).with_return_type(FileNumberList).run(chunk, self.args.query)
+                    end_time = time.monotonic()
+                    total_input_cost = 0.0
+                    total_output_cost = 0.0
+                    if meta_holder.get_meta():
+                        meta_dict = meta_holder.get_meta()
+                        total_input_cost = meta_dict.get("input_tokens_count", 0) * model_info_map.get(model_name, {}).get("input_price", 0.0) / 1000000
+                        total_output_cost = meta_dict.get("generated_tokens_count", 0) * model_info_map.get(model_name, {}).get("output_price", 0.0) / 1000000
+                    self.printer.print_in_terminal(
+                        "quick_filter_stats",
+                        style="blue",
+                        input_tokens=meta_dict.get("input_tokens_count", 0),
+                        output_tokens=meta_dict.get("generated_tokens_count", 0),
+                        input_cost=total_input_cost,
+                        output_cost=total_output_cost,
+                        model_names=model_name,
+                        elapsed_time=f"{end_time - start_time:.2f}"
+                    )
                 if file_number_list:
                     for file_number in file_number_list.file_list:
-                        file_path = get_file_path(chunk[file_number].module_name)
+                        file_path = get_file_path(
+                            chunk[file_number].module_name)
                         files[file_path] = TargetFile(
                             file_path=chunk[file_number].module_name,
-                            reason=self.printer.get_message_from_key("quick_filter_reason")
+                            reason=self.printer.get_message_from_key(
+                                "quick_filter_reason")
                         )
                 return QuickFilterResult(
                     files=files,
                     has_error=False
                 )
             except Exception as e:
                 self.printer.print_in_terminal(
                     "quick_filter_failed",
@@ -123,25 +194,25 @@ class QuickFilter():
         if chunks:
             with ThreadPoolExecutor() as executor:
                 # 提交所有chunks到线程池并收集结果
-                futures = [executor.submit(process_chunk, i, chunk)
-                          for i, chunk in enumerate(chunks)]
+                futures = [executor.submit(process_chunk, i, chunk)
+                           for i, chunk in enumerate(chunks)]
                 # 等待所有任务完成并收集结果
                 for future in futures:
                     results.append(future.result())
         # 合并所有结果
         final_files: Dict[str, TargetFile] = {}
         has_error = False
         error_messages: List[str] = []
         for result in results:
             if result.has_error:
                 has_error = True
                 if result.error_message:
                     error_messages.append(result.error_message)
             final_files.update(result.files)
         return QuickFilterResult(
             files=final_files,
             has_error=has_error,
@@ -149,7 +220,7 @@ class QuickFilter():
         )
     @byzerllm.prompt()
-    def quick_filter_files(self,file_meta_list:List[IndexItem],query:str) -> str:
+    def quick_filter_files(self, file_meta_list: List[IndexItem], query: str) -> str:
         '''
         当用户提一个需求的时候，我们需要找到相关的文件，然后阅读这些文件，并且修改其中部分文件。
         现在，给定下面的索引文件：
@@ -160,7 +231,7 @@ class QuickFilter():
         索引文件包含文件序号(##[]括起来的部分)，文件路径，文件符号信息等。
         下面是用户的查询需求：
         <query>
         {{ query }}
         </query>
@@ -182,63 +253,101 @@ class QuickFilter():
         2. 如果 query 里是一段历史对话，那么对话里的内容提及的文件路径必须要返回。
         3. json格式数据不允许有注释
         '''
-        file_meta_str = "\n".join([f"##[{index}]{item.module_name}\n{item.symbols}" for index,item in enumerate(file_meta_list)])
+        file_meta_str = "\n".join(
+            [f"##[{index}]{item.module_name}\n{item.symbols}" for index, item in enumerate(file_meta_list)])
         context = {
             "content": file_meta_str,
             "query": query
         }
-        return context
+        return context
     def filter(self, index_items: List[IndexItem], query: str) -> QuickFilterResult:
         final_files: Dict[str, TargetFile] = {}
-        start_time = time.monotonic()
+        start_time = time.monotonic()
+        prompt_str = self.quick_filter_files.prompt(index_items, query)
+        tokens_len = count_tokens(prompt_str)
-        prompt_str = self.quick_filter_files.prompt(index_items,query)
-        tokens_len = count_tokens(prompt_str)
         # Print current index size
         self.printer.print_in_terminal(
             "quick_filter_tokens_len",
             style="blue",
             tokens_len=tokens_len
         )
-        if tokens_len > self.max_tokens:
+        if tokens_len > self.max_tokens:
             return self.big_filter(index_items)
         try:
-            model_name = ",".join(get_llm_names(self.index_manager.index_filter_llm))
+            # 获取模型名称
+            model_names = get_llm_names(self.index_manager.index_filter_llm)
+            model_name = ",".join(model_names)
+            # 获取模型价格信息
+            model_info_map = {}
+            for name in model_names:
+                # 第二个参数是产品模式,从args中获取
+                info = get_model_info(name, self.args.product_mode)
+                if info:
+                    model_info_map[name] = {
+                        # 每百万tokens成本
+                        "input_price": info.get("input_price", 0.0),
+                        # 每百万tokens成本
+                        "output_price": info.get("output_price", 0.0)
+                    }
             # 渲染 Prompt 模板
-            query = self.quick_filter_files.prompt(index_items, self.args.query)
+            query = self.quick_filter_files.prompt(
+                index_items, self.args.query)
             # 使用流式输出处理
             stream_generator = stream_chat_with_continue(
                 self.index_manager.index_filter_llm,
                 [{"role": "user", "content": query}],
                 {}
             )
             # 获取完整响应
             full_response, last_meta = stream_out(
                 stream_generator,
                 model_name=model_name,
-                title=self.printer.get_message_from_key_with_format("quick_filter_title", model_name=model_name),
+                title=self.printer.get_message_from_key_with_format(
+                    "quick_filter_title", model_name=model_name),
                 args=self.args
-            )
+            )
             # 解析结果
             file_number_list = to_model(full_response, FileNumberList)
-            end_time = time.monotonic()
-            # 打印 token 统计信息
+            end_time = time.monotonic()
+            # 计算总成本
+            total_input_cost = 0.0
+            total_output_cost = 0.0
+            for name in model_names:
+                info = model_info_map.get(name, {})
+                # 计算公式:token数 * 单价 / 1000000
+                total_input_cost += (last_meta.input_tokens_count *
+                                     info.get("input_price", 0.0)) / 1000000
+                total_output_cost += (last_meta.generated_tokens_count *
+                                      info.get("output_price", 0.0)) / 1000000
+            # 四舍五入到4位小数
+            total_input_cost = round(total_input_cost, 4)
+            total_output_cost = round(total_output_cost, 4)
+            # 打印 token 统计信息和成本
             self.printer.print_in_terminal(
-                "quick_filter_stats",
+                "quick_filter_stats",
                 style="blue",
                 elapsed_time=f"{end_time - start_time:.2f}",
                 input_tokens=last_meta.input_tokens_count,
-                output_tokens=last_meta.generated_tokens_count
+                output_tokens=last_meta.generated_tokens_count,
+                input_cost=total_input_cost,
+                output_cost=total_output_cost,
+                model_names=model_name
             )
         except Exception as e:
             self.printer.print_in_terminal(
                 "quick_filter_failed",
@@ -250,16 +359,17 @@ class QuickFilter():
                 has_error=True,
                 error_message=str(e)
             )
         if file_number_list:
             for file_number in file_number_list.file_list:
                 final_files[get_file_path(index_items[file_number].module_name)] = TargetFile(
                     file_path=index_items[file_number].module_name,
-                    reason=self.printer.get_message_from_key("quick_filter_reason")
+                    reason=self.printer.get_message_from_key(
+                        "quick_filter_reason")
                 )
-        end_time = time.monotonic()
-        self.stats["timings"]["quick_filter"] = end_time - start_time
+        end_time = time.monotonic()
+        self.stats["timings"]["quick_filter"] = end_time - start_time
         return QuickFilterResult(
             files=final_files,
             has_error=False
-        )
+        )

auto-coder 0.1.255__py3-none-any.whl → 0.1.257__py3-none-any.whl

Potentially problematic release.

auto-coder 0.1.255py3-none-any.whl → 0.1.257py3-none-any.whl