PyPI - auto-coder - Versions diffs - 0.1.253__tar.gz → 0.1.256__tar.gz - Mend

auto-coder 0.1.253tar.gz → 0.1.256tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of auto-coder might be problematic. Click here for more details.

Files changed (165) hide show

{auto_coder-0.1.253 → auto_coder-0.1.256}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: auto-coder
-Version: 0.1.253
+Version: 0.1.256
 Summary: AutoCoder: AutoCoder
 Author: allwefantasy
 Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
@@ -26,7 +26,7 @@ Requires-Dist: tabulate
 Requires-Dist: jupyter_client
 Requires-Dist: prompt-toolkit
 Requires-Dist: tokenizers
-Requires-Dist: byzerllm[saas]>=0.1.163
+Requires-Dist: byzerllm[saas]>=0.1.164
 Requires-Dist: patch
 Requires-Dist: diff_match_patch
 Requires-Dist: GitPython

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/auto_coder.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: auto-coder
-Version: 0.1.253
+Version: 0.1.256
 Summary: AutoCoder: AutoCoder
 Author: allwefantasy
 Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
@@ -26,7 +26,7 @@ Requires-Dist: tabulate
 Requires-Dist: jupyter_client
 Requires-Dist: prompt-toolkit
 Requires-Dist: tokenizers
-Requires-Dist: byzerllm[saas]>=0.1.163
+Requires-Dist: byzerllm[saas]>=0.1.164
 Requires-Dist: patch
 Requires-Dist: diff_match_patch
 Requires-Dist: GitPython

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/auto_coder.egg-info/SOURCES.txt RENAMED Viewed

@@ -65,6 +65,7 @@ src/autocoder/common/mcp_hub.py
 src/autocoder/common/mcp_server.py
 src/autocoder/common/mcp_tools.py
 src/autocoder/common/memory_manager.py
+src/autocoder/common/model_speed_test.py
 src/autocoder/common/printer.py
 src/autocoder/common/recall_validation.py
 src/autocoder/common/screenshots.py
@@ -77,6 +78,7 @@ src/autocoder/common/types.py
 src/autocoder/common/utils_code_auto_generate.py
 src/autocoder/common/mcp_servers/__init__.py
 src/autocoder/common/mcp_servers/mcp_server_perplexity.py
+src/autocoder/data/byzerllm.md
 src/autocoder/data/tokenizer.json
 src/autocoder/db/__init__.py
 src/autocoder/db/store.py

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/auto_coder.egg-info/requires.txt RENAMED Viewed

@@ -16,7 +16,7 @@ tabulate
 jupyter_client
 prompt-toolkit
 tokenizers
-byzerllm[saas]>=0.1.163
+byzerllm[saas]>=0.1.164
 patch
 diff_match_patch
 GitPython

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/auto_coder.py RENAMED Viewed

@@ -256,11 +256,13 @@ def main(input_args: Optional[List[str]] = None):
             libs_dir = os.path.join(auto_coder_dir, "storage", "libs")
             code_search_path = None
             if os.path.exists(libs_dir):
-                retrieval_libs_dir = os.path.join(
-                    libs_dir, get_latest_byzer_retrieval_lib(libs_dir)
-                )
-                if os.path.exists(retrieval_libs_dir):
-                    code_search_path = [retrieval_libs_dir]
+                latest_retrieval_lib_dir = get_latest_byzer_retrieval_lib(libs_dir)
+                if latest_retrieval_lib_dir :
+                    retrieval_libs_dir = os.path.join(
+                        libs_dir, latest_retrieval_lib_dir
+                    )
+                    if os.path.exists(retrieval_libs_dir):
+                        code_search_path = [retrieval_libs_dir]
             try:
                 init_options = {}
@@ -1387,11 +1389,25 @@ def main(input_args: Optional[List[str]] = None):
                 elapsed_time = time.time() - start_time
                 printer = Printer()
                 speed = last_meta.generated_tokens_count / elapsed_time
+                # Get model info for pricing
+                from autocoder.utils import llms as llm_utils
+                model_info = llm_utils.get_model_info(model_name, args.product_mode) or {}
+                input_price = model_info.get("input_price", 0.0) if model_info else 0.0
+                output_price = model_info.get("output_price", 0.0) if model_info else 0.0
+                # Calculate costs
+                input_cost = (last_meta.input_tokens_count * input_price) / 1000000  # Convert to millions
+                output_cost = (last_meta.generated_tokens_count * output_price) / 1000000  # Convert to millions
                 printer.print_in_terminal("stream_out_stats",
+                                    model_name=model_name,
                                     elapsed_time=elapsed_time,
                                     first_token_time=last_meta.first_token_time,
                                     input_tokens=last_meta.input_tokens_count,
                                     output_tokens=last_meta.generated_tokens_count,
+                                    input_cost=round(input_cost, 4),
+                                    output_cost=round(output_cost, 4),
                                     speed=round(speed, 2))
             chat_history["ask_conversation"].append(

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/chat_auto_coder.py RENAMED Viewed

@@ -2197,24 +2197,49 @@ def manage_models(params, query: str):
         subcmd = "/remove"
         query = query.replace("/remove", "", 1).strip()
+    if "/speed-test" in query:
+        subcmd = "/speed-test"
+        query = query.replace("/speed-test", "", 1).strip()
+    if "/speed_test" in query:
+        subcmd = "/speed-test"
+        query = query.replace("/speed_test", "", 1).strip()
+    if "input_price" in query:
+        subcmd = "/input_price"
+        query = query.replace("/input_price", "", 1).strip()
+    if "output_price" in query:
+        subcmd = "/output_price"
+        query = query.replace("/output_price", "", 1).strip()
+    if "/speed" in query:
+        subcmd = "/speed"
+        query = query.replace("/speed", "", 1).strip()
     if not subcmd:
-        printer.print_in_terminal("models_usage")
-        return
+        printer.print_in_terminal("models_usage")
     if subcmd == "/list":
         if models_data:
+            # Sort models by speed (average_speed)
+            sorted_models = sorted(models_data, key=lambda x: float(x.get('average_speed', 0)))
+            sorted_models.reverse()
             table = Table(
                 title=printer.get_message_from_key("models_title"),
                 expand=True,
                 show_lines=True
             )
-            table.add_column("Name", style="cyan", width=40, no_wrap=False)
-            table.add_column("Model Name", style="magenta", width=30, overflow="fold")
-            table.add_column("Base URL", style="white", width=50, overflow="fold")
-            table.add_column("Input Price (M)", style="magenta", width=15)
-            table.add_column("Output Price (M)", style="magenta", width=15)
-            table.add_column("Speed (s/req)", style="blue", width=15)
-            for m in models_data:
+            table.add_column("Name", style="cyan", width=30, overflow="fold", no_wrap=False)
+            table.add_column("Model Name", style="magenta", width=30, overflow="fold", no_wrap=False)
+            table.add_column("Base URL", style="white", width=40, overflow="fold", no_wrap=False)
+            table.add_column("Input Price (M)", style="magenta", width=15, overflow="fold", no_wrap=False)
+            table.add_column("Output Price (M)", style="magenta", width=15, overflow="fold", no_wrap=False)
+            table.add_column("Speed (s/req)", style="blue", width=15, overflow="fold", no_wrap=False)
+            for m in sorted_models:
                 # Check if api_key_path exists and file exists
                 is_api_key_set = "api_key" in m
                 name = m.get("name", "")
@@ -2281,6 +2306,26 @@ def manage_models(params, query: str):
         else:
             printer.print_in_terminal("models_speed_usage", style="red")
+    elif subcmd == "/speed-test":
+        from autocoder.common.model_speed_test import render_speed_test_in_terminal
+        test_rounds = 1  # 默认测试轮数
+        enable_long_context = False
+        if "/long_context" in query:
+            enable_long_context = True
+            query = query.replace("/long_context", "", 1).strip()
+        if "/long-context" in query:
+            enable_long_context = True
+            query = query.replace("/long-context", "", 1).strip()
+        # 解析可选的测试轮数参数
+        args = query.strip().split()
+        if args and args[0].isdigit():
+            test_rounds = int(args[0])
+        render_speed_test_in_terminal(params.product_mode, test_rounds,enable_long_context=enable_long_context)
     elif subcmd == "/add":
         # Support both simplified and legacy formats
         args = query.strip().split(" ")

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/chat_auto_coder_lang.py RENAMED Viewed

@@ -85,7 +85,7 @@ MESSAGES = {
         "design_desc": "Generate SVG image based on the provided description",
         "commit_desc": "Auto generate yaml file and commit changes based on user's manual changes",
         "models_desc": "Manage model configurations, only available in lite mode",
-        "models_usage": "Usage: /models /list|/add|/add_model|/remove|/price|/speed ...",
+        "models_usage": "Usage: /models <command>\nAvailable subcommands:\n  /list - List all models\n  /add <name> <api_key> - Add a built-in model\n  /add_model - Add a custom model\n  /remove <name> - Remove a model\n  /input_price <name> <value> - Set model input price\n  /output_price <name> <value> - Set model output price\n  /speed <name> <value> - Set model speed\n  /speed-test - Test models speed\n  /speed-test-long - Test models speed with long context",
         "models_added": "Added/Updated model '{{name}}' successfully.",
         "models_add_failed": "Failed to add model '{{name}}'. Model not found in defaults.",
         "models_add_usage": "Usage: /models /add <name> <api_key> or\n/models /add <name> <model_type> <model_name> <base_url> <api_key_path> [description]",
@@ -213,7 +213,7 @@ MESSAGES = {
         "conf_value": "值",
         "conf_title": "配置设置",
         "conf_subtitle": "使用 /conf <key>:<value> 修改这些设置",
-        "models_usage": "用法: /models /list|/add|/add_model|/remove|/price|/speed ...",
+        "models_usage": "用法: /models <命令>\n可用的子命令:\n  /list - 列出所有模型\n  /add <名称> <API密钥> - 添加内置模型\n  /add_model - 添加自定义模型\n  /remove <名称> - 移除模型\n  /input_price <名称> <价格> - 设置模型输入价格\n  /output_price <名称> <价格> - 设置模型输出价格\n  /speed <名称> <速度> - 设置模型速度\n  /speed-test - 测试模型速度\n  /speed-test-long - 使用长文本上下文测试模型速度",
         "models_added": "成功添加/更新模型 '{{name}}'。",
         "models_add_failed": "添加模型 '{{name}}' 失败。在默认模型中未找到该模型。",
         "models_add_usage": "用法: /models /add <name> <api_key> 或\n/models /add <name> <model_type> <model_name> <base_url> <api_key_path> [description]",

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/auto_coder_lang.py RENAMED Viewed

@@ -3,6 +3,11 @@ from byzerllm.utils import format_str_jinja2
 MESSAGES = {
     "en": {
+        "models_no_active": "No active models found",
+        "models_speed_test_results": "Model Speed Test Results",
+        "models_testing": "Testing model: {{name}}...",
+        "models_testing_start": "Starting speed test for all active models...",
+        "models_testing_progress": "Testing progress: {{ completed }}/{{ total }} models",
         "generation_cancelled": "[Interrupted] Generation cancelled",
         "model_not_found": "Model {{model_name}} not found",
         "generating_shell_script": "Generating Shell Script",
@@ -52,7 +57,7 @@ MESSAGES = {
             "Paste the answer to the input box below, use '/break' to exit, '/clear' to clear the screen, '/eof' to submit."
         ),
         "code_generation_start": "Auto generate the code...",
-        "code_generation_complete": "Code generation completed in {{ duration }} seconds, input_tokens_count: {{ input_tokens }}, generated_tokens_count: {{ output_tokens }}, speed: {{ speed }} tokens/s",
+        "code_generation_complete": "{{ model_names}} Code generation completed in {{ duration }} seconds, input_tokens_count: {{ input_tokens }}, generated_tokens_count: {{ output_tokens }}, input_cost: {{ input_cost }}, output_cost: {{ output_cost }}, speed: {{ speed }} tokens/s",
         "code_merge_start": "Auto merge the code...",
         "code_execution_warning": "Content(send to model) is {{ content_length }} tokens (you may collect too much files), which is larger than the maximum input length {{ max_length }}",
         "quick_filter_start": "{{ model_name }} Starting filter context(quick_filter)...",
@@ -70,12 +75,12 @@ MESSAGES = {
         "ranking_start": "Start ranking {{ count }} candidates using model {{ model_name }}",
         "ranking_failed_request": "Ranking request failed: {{ error }}",
         "ranking_all_failed": "All ranking requests failed",
-        "ranking_complete": "Ranking completed in {{ elapsed }}s, total voters: {{ total_tasks }}, best candidate index: {{ best_candidate }}, scores: {{ scores }}, input_tokens: {{ input_tokens }}, output_tokens: {{ output_tokens }}",
+        "ranking_complete": "{{ model_names }} Ranking completed in {{ elapsed }}s, total voters: {{ total_tasks }}, best candidate index: {{ best_candidate }}, scores: {{ scores }}, input_tokens: {{ input_tokens }}, output_tokens: {{ output_tokens }}, input_cost: {{ input_cost }}, output_cost: {{ output_cost }}",
         "ranking_process_failed": "Ranking process failed: {{ error }}",
         "ranking_failed": "Ranking failed in {{ elapsed }}s, using original order",
         "begin_index_source_code": "🚀 Begin to index source code in {{ source_dir }}",
-        "stream_out_stats": "Elapsed time {{ elapsed_time }} seconds, first token time: {{ first_token_time }} seconds, input tokens: {{ input_tokens }}, output tokens: {{ output_tokens }}, speed: {{ speed }} tokens/s",
-        "quick_filter_stats": "快速过滤器完成，耗时 {{ elapsed_time }} 秒，输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}",
+        "stream_out_stats": "Model: {{ model_name }}, Total time: {{ elapsed_time }} seconds, First token time: {{ first_token_time }} seconds, Speed: {{ speed }} tokens/s, Input tokens: {{ input_tokens }}, Output tokens: {{ output_tokens }}, Input cost: {{ input_cost }}, Output cost: {{ output_cost }}",
+        "quick_filter_stats": "{{ model_names }} 快速过滤器完成，耗时 {{ elapsed_time }} 秒，输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}, 输入成本: {{ input_cost }}, 输出成本: {{ output_cost }}",
         "upsert_file": "✅ Updated file: {{ file_path }}",
         "unmerged_blocks_title": "Unmerged Blocks",
         "quick_filter_title": "{{ model_name }} is analyzing how to filter context...",
@@ -92,6 +97,10 @@ MESSAGES = {
         "estimated_input_tokens_in_generate": "Estimated input tokens in generate ({{ generate_mode }}): {{ estimated_input_tokens }}",
     },
     "zh": {
+        "models_no_active": "未找到激活的模型",
+        "models_speed_test_results": "模型速度测试结果",
+        "models_testing": "正在测试模型: {{name}}...",
+        "models_testing_start": "开始对所有激活的模型进行速度测试...",
         "generation_cancelled": "[已中断] 生成已取消",
         "model_not_found": "未找到模型: {{model_name}}",
         "generating_shell_script": "正在生成 Shell 脚本",
@@ -141,7 +150,7 @@ MESSAGES = {
             "将获得答案黏贴到下面的输入框，换行后，使用 '/break' 退出，'/clear' 清屏，'/eof' 提交。"
         ),
         "code_generation_start": "正在自动生成代码...",
-        "code_generation_complete": "代码生成完成，耗时 {{ duration }} 秒，输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}, 速度: {{ speed }} tokens/秒",
+        "code_generation_complete": "{{ model_names}} 代码生成完成，耗时 {{ duration }} 秒，输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}, 输入成本: {{ input_cost }}, 输出成本: {{ output_cost }}, 速度: {{ speed }} tokens/秒",
         "code_merge_start": "正在自动合并代码...",
         "code_execution_warning": "发送给模型的内容长度为 {{ content_length }} tokens（您可能收集了太多文件），超过了最大输入长度 {{ max_length }}",
         "quick_filter_start": "{{ model_name }} 开始查找上下文(quick_filter)...",
@@ -170,11 +179,11 @@ MESSAGES = {
         "ranking_start": "开始对 {{ count }} 个候选项进行排序,使用模型 {{ model_name }} 打分",
         "ranking_failed_request": "排序请求失败: {{ error }}",
         "ranking_all_failed": "所有排序请求都失败",
-        "ranking_complete": "排序完成，耗时 {{ elapsed }} 秒，总投票数: {{ total_tasks }}，最佳候选索引: {{ best_candidate }}，得分: {{ scores }}，输入token数: {{ input_tokens }}，输出token数: {{ output_tokens }}",
+        "ranking_complete": "{{ model_names }} 排序完成，耗时 {{ elapsed }} 秒，总投票数: {{ total_tasks }}，最佳候选索引: {{ best_candidate }}，得分: {{ scores }}，输入token数: {{ input_tokens }}，输出token数: {{ output_tokens }}  输入成本: {{ input_cost }}, 输出成本: {{ output_cost }}",
         "ranking_process_failed": "排序过程失败: {{ error }}",
         "ranking_failed": "排序失败，耗时 {{ elapsed }} 秒，使用原始顺序",
-        "stream_out_stats": "总耗时 {{ elapsed_time }} 秒，首token时间: {{ first_token_time }} 秒，输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}, 速度: {{ speed }} tokens/秒",
-        "quick_filter_stats": "Quick filter completed in {{ elapsed_time }} seconds, input tokens: {{ input_tokens }}, output tokens: {{ output_tokens }}",
+        "stream_out_stats": "模型: {{ model_name }},总耗时 {{ elapsed_time }} 秒,首token时间: {{ first_token_time }} 秒, 速度: {{ speed }} tokens/秒, 输入token数: {{ input_tokens }}, 输出token数: {{ output_tokens }}, 输入成本: {{ input_cost }}, 输出成本: {{ output_cost }}",
+        "quick_filter_stats": "{{ model_names }} Quick filter completed in {{ elapsed_time }} seconds, input tokens: {{ input_tokens }}, output tokens: {{ output_tokens }}, input cost: {{ input_cost }}, output cost: {{ output_cost }}",
         "quick_filter_title": "{{ model_name }} 正在分析如何筛选上下文...",
         "quick_filter_failed": "❌ 快速过滤器失败: {{ error }}. ",
         "estimated_chat_input_tokens": "对话输入token预估为: {{ estimated_input_tokens }}",

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/code_auto_generate.py RENAMED Viewed

@@ -10,6 +10,7 @@ from autocoder.common.utils_code_auto_generate import chat_with_continue
 import json
 from autocoder.common.printer import Printer
 from autocoder.rag.token_counter import count_tokens
+from autocoder.utils import llms as llm_utils
 class CodeAutoGenerate:
@@ -193,6 +194,9 @@ class CodeAutoGenerate:
         results = []
         input_tokens_count = 0
         generated_tokens_count = 0
+        input_tokens_cost = 0
+        generated_tokens_cost = 0
+        model_names = []
         printer = Printer()
         estimated_input_tokens = count_tokens(json.dumps(conversations, ensure_ascii=False))
@@ -206,13 +210,27 @@ class CodeAutoGenerate:
                 futures = []
                 for llm in self.llms:
                     for _ in range(self.generate_times_same_model):
-                        futures.append(executor.submit(
-                            chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
+                        model_names_list = llm_utils.get_llm_names(llm)
+                        model_name = None
+                        if model_names_list:
+                            model_name = model_names_list[0]
+                        for _ in range(self.generate_times_same_model):
+                            model_names.append(model_name)
+                            futures.append(executor.submit(
+                                chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
                 temp_results = [future.result() for future in futures]
                 for result in temp_results:
                     results.append(result.content)
                     input_tokens_count += result.input_tokens_count
                     generated_tokens_count += result.generated_tokens_count
+                    model_info = llm_utils.get_model_info(model_name, self.args.product_mode)
+                    input_cost = model_info.get("input_price", 0) if model_info else 0
+                    output_cost = model_info.get("output_price", 0) if model_info else 0
+                    input_tokens_cost += input_cost * result.input_tokens_count / 1000000
+                    generated_tokens_cost += output_cost * result.generated_tokens_count / 1000000
             for result in results:
                 conversations_list.append(
@@ -227,7 +245,9 @@ class CodeAutoGenerate:
         statistics = {
             "input_tokens_count": input_tokens_count,
-            "generated_tokens_count": generated_tokens_count
+            "generated_tokens_count": generated_tokens_count,
+            "input_tokens_cost": input_tokens_cost,
+            "generated_tokens_cost": generated_tokens_cost
         }
         if self.args.request_id and not self.args.skip_events:

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/code_auto_generate_diff.py RENAMED Viewed

@@ -9,6 +9,7 @@ import json
 from autocoder.common.utils_code_auto_generate import chat_with_continue
 from autocoder.common.printer import Printer
 from autocoder.rag.token_counter import count_tokens
+from autocoder.utils import llms as llm_utils
 class CodeAutoGenerateDiff:
@@ -341,6 +342,9 @@ class CodeAutoGenerateDiff:
         results = []
         input_tokens_count = 0
         generated_tokens_count = 0
+        input_tokens_cost = 0
+        generated_tokens_cost = 0
+        model_names = []
         printer = Printer()
         estimated_input_tokens = count_tokens(json.dumps(conversations, ensure_ascii=False))
@@ -354,13 +358,26 @@ class CodeAutoGenerateDiff:
                 futures = []
                 for llm in self.llms:
                     for _ in range(self.generate_times_same_model):
-                        futures.append(executor.submit(
-                            chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
+                        model_names_list = llm_utils.get_llm_names(llm)
+                        model_name = None
+                        if model_names_list:
+                            model_name = model_names_list[0]
+                        for _ in range(self.generate_times_same_model):
+                            model_names.append(model_name)
+                            futures.append(executor.submit(
+                                chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
                 temp_results = [future.result() for future in futures]
                 for result in temp_results:
                     results.append(result.content)
                     input_tokens_count += result.input_tokens_count
                     generated_tokens_count += result.generated_tokens_count
+                    model_info = llm_utils.get_model_info(model_name, self.args.product_mode)
+                    input_cost = model_info.get("input_price",0) if model_info else 0
+                    output_cost = model_info.get("output_price",0) if model_info else 0
+                    input_tokens_cost += input_cost * result.input_tokens_count / 1000000
+                    generated_tokens_cost += output_cost * result.generated_tokens_count / 1000000
             for result in results:
                 conversations_list.append(
@@ -376,7 +393,9 @@ class CodeAutoGenerateDiff:
         statistics = {
             "input_tokens_count": input_tokens_count,
-            "generated_tokens_count": generated_tokens_count
+            "generated_tokens_count": generated_tokens_count,
+            "input_tokens_cost": input_tokens_cost,
+            "generated_tokens_cost": generated_tokens_cost
         }
         if self.args.request_id and not self.args.skip_events:

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/code_auto_generate_editblock.py RENAMED Viewed

@@ -13,6 +13,7 @@ from concurrent.futures import ThreadPoolExecutor
 from autocoder.common.utils_code_auto_generate import chat_with_continue
 from autocoder.common.printer import Printer
 from autocoder.rag.token_counter import count_tokens
+from autocoder.utils import llms as llm_utils
 class CodeAutoGenerateEditBlock:
@@ -424,6 +425,11 @@ class CodeAutoGenerateEditBlock:
         input_tokens_count = 0
         generated_tokens_count = 0
+        input_tokens_cost = 0
+        generated_tokens_cost = 0
+        model_names = []
         printer = Printer()
         estimated_input_tokens = count_tokens(
             json.dumps(conversations, ensure_ascii=False))
@@ -437,14 +443,28 @@ class CodeAutoGenerateEditBlock:
             with ThreadPoolExecutor(max_workers=len(self.llms) * self.generate_times_same_model) as executor:
                 futures = []
                 for llm in self.llms:
+                    model_names_list = llm_utils.get_llm_names(llm)
+                    model_name = None
+                    if model_names_list:
+                        model_name = model_names_list[0]
                     for _ in range(self.generate_times_same_model):
+                        model_names.append(model_name)
                         futures.append(executor.submit(
                             chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
                 temp_results = [future.result() for future in futures]
-                for result in temp_results:
+                for result,model_name in zip(temp_results,model_names):
                     results.append(result.content)
                     input_tokens_count += result.input_tokens_count
                     generated_tokens_count += result.generated_tokens_count
+                    model_info = llm_utils.get_model_info(model_name,self.args.product_mode)
+                    input_cost = model_info.get("input_price", 0) if model_info else 0
+                    output_cost = model_info.get("output_price", 0) if model_info else 0
+                    input_tokens_cost += input_cost * result.input_tokens_count / 1000000
+                    generated_tokens_cost += output_cost * result.generated_tokens_count / 1000000
             for result in results:
                 conversations_list.append(
@@ -461,7 +481,9 @@ class CodeAutoGenerateEditBlock:
         statistics = {
             "input_tokens_count": input_tokens_count,
-            "generated_tokens_count": generated_tokens_count
+            "generated_tokens_count": generated_tokens_count,
+            "input_tokens_cost": input_tokens_cost,
+            "generated_tokens_cost": generated_tokens_cost
         }
         if self.args.request_id and not self.args.skip_events:

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/code_auto_generate_strict_diff.py RENAMED Viewed

@@ -9,6 +9,7 @@ import json
 from autocoder.common.utils_code_auto_generate import chat_with_continue
 from autocoder.common.printer import Printer
 from autocoder.rag.token_counter import count_tokens
+from autocoder.utils import llms as llm_utils
 class CodeAutoGenerateStrictDiff:
     def __init__(
@@ -311,6 +312,9 @@ class CodeAutoGenerateStrictDiff:
         results = []
         input_tokens_count = 0
         generated_tokens_count = 0
+        input_tokens_cost = 0
+        generated_tokens_cost = 0
+        model_names = []
         printer = Printer()
         estimated_input_tokens = count_tokens(json.dumps(conversations, ensure_ascii=False))
@@ -324,14 +328,27 @@ class CodeAutoGenerateStrictDiff:
                 futures = []
                 for llm in self.llms:
                     for _ in range(self.generate_times_same_model):
-                        futures.append(executor.submit(
-                            chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
+                        model_names_list = llm_utils.get_llm_names(llm)
+                        model_name = None
+                        if model_names_list:
+                            model_name = model_names_list[0]
+                        for _ in range(self.generate_times_same_model):
+                            model_names.append(model_name)
+                            futures.append(executor.submit(
+                                chat_with_continue, llm=llm, conversations=conversations, llm_config=llm_config))
                 temp_results = [future.result() for future in futures]
                 for result in temp_results:
                     results.append(result.content)
                     input_tokens_count += result.input_tokens_count
                     generated_tokens_count += result.generated_tokens_count
+                    model_info = llm_utils.get_model_info(model_name, self.args.product_mode)
+                    input_cost = model_info.get("input_price", 0) if model_info else 0
+                    output_cost = model_info.get("output_price", 0) if model_info else 0
+                    input_tokens_cost += input_cost * result.input_tokens_count / 1000000
+                    generated_tokens_cost += output_cost * result.generated_tokens_count / 1000000
             for result in results:
                 conversations_list.append(
                     conversations + [{"role": "assistant", "content": result}])
@@ -345,7 +362,9 @@ class CodeAutoGenerateStrictDiff:
         statistics = {
             "input_tokens_count": input_tokens_count,
-            "generated_tokens_count": generated_tokens_count
+            "generated_tokens_count": generated_tokens_count,
+            "input_tokens_cost": input_tokens_cost,
+            "generated_tokens_cost": generated_tokens_cost
         }
         if self.args.request_id and not self.args.skip_events:

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/code_modification_ranker.py RENAMED Viewed

@@ -8,8 +8,8 @@ from concurrent.futures import ThreadPoolExecutor, as_completed
 import traceback
 from autocoder.common.utils_code_auto_generate import chat_with_continue
 from byzerllm.utils.str2model import to_model
+from autocoder.utils.llms import get_llm_names, get_model_info
-from autocoder.utils.llms import get_llm_names
 class RankResult(BaseModel):
     rank_result: List[int]
@@ -97,13 +97,42 @@ class CodeModificationRanker:
                 # Collect all results
                 results = []
-                for future in as_completed(futures):
+                # 获取模型名称列表
+                model_names = []
+                for llm in self.llms:
+                    # 获取当前llm实例对应的模型名称
+                    names = get_llm_names(llm)
+                    model_names.extend(names)
+                # 获取模型价格信息
+                model_info_map = {}
+                for name in model_names:
+                    # 第二个参数是产品模式,从args中获取
+                    info = get_model_info(name, self.args.product_mode)
+                    if info:
+                        model_info_map[name] = {
+                            "input_cost": info.get("input_price", 0.0),  # 每百万tokens成本
+                            "output_cost": info.get("output_price", 0.0) # 每百万tokens成本
+                        }
+                # 计算总成本
+                total_input_cost = 0.0
+                total_output_cost = 0.0
+                for future, model_name in zip(futures, model_names):
                     try:
                         result = future.result()
                         input_tokens_count += result.input_tokens_count
                         generated_tokens_count += result.generated_tokens_count
                         v = to_model(result.content,RankResult)
                         results.append(v.rank_result)
+                        # 计算成本
+                        info = model_info_map.get(model_name, {})
+                        # 计算公式:token数 * 单价 / 1000000
+                        total_input_cost += (result.input_tokens_count * info.get("input_cost", 0.0)) / 1000000
+                        total_output_cost += (result.generated_tokens_count * info.get("output_cost", 0.0)) / 1000000
                     except Exception as e:
                         self.printer.print_in_terminal(
                             "ranking_failed_request", style="yellow", error=str(e))
@@ -113,6 +142,10 @@ class CodeModificationRanker:
                     raise Exception(
                         self.printer.get_message_from_key("ranking_all_failed"))
+                # 四舍五入到4位小数
+                total_input_cost = round(total_input_cost, 4)
+                total_output_cost = round(total_output_cost, 4)
                 # Calculate scores for each candidate
                 candidate_scores = defaultdict(float)
                 for rank_result in results:
@@ -137,7 +170,10 @@ class CodeModificationRanker:
                     best_candidate=sorted_candidates[0],
                     scores=score_details,
                     input_tokens=input_tokens_count,
-                    output_tokens=generated_tokens_count
+                    output_tokens=generated_tokens_count,
+                    input_cost=total_input_cost,
+                    output_cost=total_output_cost,
+                    model_names=", ".join(model_names)
                 )
                 rerank_contents = [generate_result.contents[i]

{auto_coder-0.1.253 → auto_coder-0.1.256}/src/autocoder/common/command_completer.py RENAMED Viewed

@@ -33,7 +33,11 @@ COMMANDS = {
         "/add": "",
         "/add_model": "",
         "/remove": "",
-        "/list": ""
+        "/list": "",
+        "/speed": "",
+        "/speed-test": "",
+        "/input_price": "",
+        "/output_price": "",
     }
 }

auto-coder 0.1.253__tar.gz → 0.1.256__tar.gz

Potentially problematic release.

auto-coder 0.1.253tar.gz → 0.1.256tar.gz