PyPI - auto-coder - Versions diffs - 1.0.0__py3-none-any.whl → 2.0.0__py3-none-any.whl - Mend

auto-coder 1.0.0py3-none-any.whl → 2.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of auto-coder might be problematic. Click here for more details.

Files changed (574) hide show

auto_coder-2.0.0.dist-info/LICENSE +158 -0
auto_coder-2.0.0.dist-info/METADATA +558 -0
auto_coder-2.0.0.dist-info/RECORD +795 -0
{auto_coder-1.0.0.dist-info → auto_coder-2.0.0.dist-info}/WHEEL +1 -1
{auto_coder-1.0.0.dist-info → auto_coder-2.0.0.dist-info}/entry_points.txt +3 -3
autocoder/__init__.py +31 -0
autocoder/agent/auto_filegroup.py +32 -13
autocoder/agent/auto_learn_from_commit.py +9 -1
autocoder/agent/base_agentic/__init__.py +3 -0
autocoder/agent/base_agentic/agent_hub.py +1 -1
autocoder/agent/base_agentic/base_agent.py +235 -136
autocoder/agent/base_agentic/default_tools.py +119 -118
autocoder/agent/base_agentic/test_base_agent.py +1 -1
autocoder/agent/base_agentic/tool_registry.py +32 -20
autocoder/agent/base_agentic/tools/read_file_tool_resolver.py +24 -3
autocoder/agent/base_agentic/tools/write_to_file_tool_resolver.py +24 -11
autocoder/agent/base_agentic/types.py +42 -0
autocoder/agent/entry_command_agent/chat.py +73 -59
autocoder/auto_coder.py +31 -40
autocoder/auto_coder_rag.py +11 -1084
autocoder/auto_coder_runner.py +970 -2345
autocoder/auto_coder_terminal.py +26 -0
autocoder/auto_coder_terminal_v3.py +190 -0
autocoder/chat/conf_command.py +224 -124
autocoder/chat/models_command.py +361 -299
autocoder/chat/rules_command.py +79 -31
autocoder/chat_auto_coder.py +988 -398
autocoder/chat_auto_coder_lang.py +23 -732
autocoder/commands/auto_command.py +25 -8
autocoder/commands/auto_web.py +1 -1
autocoder/commands/tools.py +44 -44
autocoder/common/__init__.py +150 -128
autocoder/common/ac_style_command_parser/__init__.py +39 -2
autocoder/common/ac_style_command_parser/config.py +422 -0
autocoder/common/ac_style_command_parser/parser.py +292 -78
autocoder/common/ac_style_command_parser/test_parser.py +241 -16
autocoder/common/ac_style_command_parser/test_typed_parser.py +342 -0
autocoder/common/ac_style_command_parser/typed_parser.py +653 -0
autocoder/common/action_yml_file_manager.py +25 -13
autocoder/common/agent_events/__init__.py +52 -0
autocoder/common/agent_events/agent_event_emitter.py +193 -0
autocoder/common/agent_events/event_factory.py +177 -0
autocoder/common/agent_events/examples.py +307 -0
autocoder/common/agent_events/types.py +113 -0
autocoder/common/agent_events/utils.py +68 -0
autocoder/common/agent_hooks/__init__.py +44 -0
autocoder/common/agent_hooks/examples.py +582 -0
autocoder/common/agent_hooks/hook_executor.py +217 -0
autocoder/common/agent_hooks/hook_manager.py +288 -0
autocoder/common/agent_hooks/types.py +133 -0
autocoder/common/agent_hooks/utils.py +99 -0
autocoder/common/agent_query_queue/queue_executor.py +324 -0
autocoder/common/agent_query_queue/queue_manager.py +325 -0
autocoder/common/agents/__init__.py +11 -0
autocoder/common/agents/agent_manager.py +323 -0
autocoder/common/agents/agent_parser.py +189 -0
autocoder/common/agents/example_usage.py +344 -0
autocoder/common/agents/integration_example.py +330 -0
autocoder/common/agents/test_agent_parser.py +545 -0
autocoder/common/async_utils.py +101 -0
autocoder/common/auto_coder_lang.py +23 -972
autocoder/common/autocoderargs_parser/__init__.py +14 -0
autocoder/common/autocoderargs_parser/parser.py +184 -0
autocoder/common/autocoderargs_parser/tests/__init__.py +1 -0
autocoder/common/autocoderargs_parser/tests/test_args_parser.py +235 -0
autocoder/common/autocoderargs_parser/tests/test_token_parser.py +195 -0
autocoder/common/autocoderargs_parser/token_parser.py +290 -0
autocoder/common/buildin_tokenizer.py +2 -4
autocoder/common/code_auto_generate.py +149 -74
autocoder/common/code_auto_generate_diff.py +163 -70
autocoder/common/code_auto_generate_editblock.py +179 -89
autocoder/common/code_auto_generate_strict_diff.py +167 -72
autocoder/common/code_auto_merge_editblock.py +13 -6
autocoder/common/code_modification_ranker.py +1 -1
autocoder/common/command_completer.py +3 -3
autocoder/common/command_file_manager/manager.py +183 -47
autocoder/common/command_file_manager/test_command_file_manager.py +507 -0
autocoder/common/command_templates.py +1 -1
autocoder/common/conf_utils.py +2 -4
autocoder/common/conversations/config.py +11 -3
autocoder/common/conversations/get_conversation_manager.py +100 -2
autocoder/common/conversations/llm_stats_models.py +264 -0
autocoder/common/conversations/manager.py +112 -28
autocoder/common/conversations/models.py +16 -2
autocoder/common/conversations/storage/index_manager.py +134 -10
autocoder/common/core_config/__init__.py +63 -0
autocoder/common/core_config/agentic_mode_manager.py +109 -0
autocoder/common/core_config/base_manager.py +123 -0
autocoder/common/core_config/compatibility.py +151 -0
autocoder/common/core_config/config_manager.py +156 -0
autocoder/common/core_config/conversation_manager.py +31 -0
autocoder/common/core_config/exclude_manager.py +72 -0
autocoder/common/core_config/file_manager.py +177 -0
autocoder/common/core_config/human_as_model_manager.py +129 -0
autocoder/common/core_config/lib_manager.py +54 -0
autocoder/common/core_config/main_manager.py +81 -0
autocoder/common/core_config/mode_manager.py +126 -0
autocoder/common/core_config/models.py +70 -0
autocoder/common/core_config/test_memory_manager.py +1056 -0
autocoder/common/env_manager.py +282 -0
autocoder/common/env_manager_usage_example.py +211 -0
autocoder/common/file_checkpoint/conversation_checkpoint.py +19 -19
autocoder/common/file_checkpoint/manager.py +264 -48
autocoder/common/file_checkpoint/test_backup.py +1 -18
autocoder/common/file_checkpoint/test_manager.py +270 -1
autocoder/common/file_checkpoint/test_store.py +1 -17
autocoder/common/file_handler/__init__.py +23 -0
autocoder/common/file_handler/active_context_handler.py +159 -0
autocoder/common/file_handler/add_files_handler.py +409 -0
autocoder/common/file_handler/chat_handler.py +180 -0
autocoder/common/file_handler/coding_handler.py +401 -0
autocoder/common/file_handler/commit_handler.py +200 -0
autocoder/common/file_handler/lib_handler.py +156 -0
autocoder/common/file_handler/list_files_handler.py +111 -0
autocoder/common/file_handler/mcp_handler.py +268 -0
autocoder/common/file_handler/models_handler.py +493 -0
autocoder/common/file_handler/remove_files_handler.py +172 -0
autocoder/common/git_utils.py +44 -8
autocoder/common/global_cancel.py +15 -6
autocoder/common/ignorefiles/test_ignore_file_utils.py +1 -1
autocoder/common/international/__init__.py +31 -0
autocoder/common/international/demo_international.py +92 -0
autocoder/common/international/message_manager.py +157 -0
autocoder/common/international/messages/__init__.py +56 -0
autocoder/common/international/messages/async_command_messages.py +507 -0
autocoder/common/international/messages/auto_coder_messages.py +2208 -0
autocoder/common/international/messages/chat_auto_coder_messages.py +1547 -0
autocoder/common/international/messages/command_help_messages.py +986 -0
autocoder/common/international/messages/conversation_command_messages.py +191 -0
autocoder/common/international/messages/git_helper_plugin_messages.py +159 -0
autocoder/common/international/messages/queue_command_messages.py +751 -0
autocoder/common/international/messages/rules_command_messages.py +77 -0
autocoder/common/international/messages/sdk_messages.py +1707 -0
autocoder/common/international/messages/token_helper_plugin_messages.py +361 -0
autocoder/common/international/messages/tool_display_messages.py +1212 -0
autocoder/common/international/messages/workflow_exception_messages.py +473 -0
autocoder/common/international/test_international.py +612 -0
autocoder/common/linter_core/__init__.py +28 -0
autocoder/common/linter_core/base_linter.py +61 -0
autocoder/common/linter_core/config_loader.py +271 -0
autocoder/common/linter_core/formatters/__init__.py +0 -0
autocoder/common/linter_core/formatters/base_formatter.py +38 -0
autocoder/common/linter_core/formatters/raw_formatter.py +17 -0
autocoder/common/linter_core/linter.py +166 -0
autocoder/common/linter_core/linter_factory.py +216 -0
autocoder/common/linter_core/linter_manager.py +333 -0
autocoder/common/linter_core/linters/__init__.py +9 -0
autocoder/common/linter_core/linters/java_linter.py +342 -0
autocoder/common/linter_core/linters/python_linter.py +115 -0
autocoder/common/linter_core/linters/typescript_linter.py +119 -0
autocoder/common/linter_core/models/__init__.py +7 -0
autocoder/common/linter_core/models/lint_result.py +91 -0
autocoder/common/linter_core/models.py +33 -0
autocoder/common/linter_core/tests/__init__.py +3 -0
autocoder/common/linter_core/tests/test_config_loader.py +323 -0
autocoder/common/linter_core/tests/test_config_loading.py +308 -0
autocoder/common/linter_core/tests/test_factory_manager.py +234 -0
autocoder/common/linter_core/tests/test_formatters.py +147 -0
autocoder/common/linter_core/tests/test_integration.py +317 -0
autocoder/common/linter_core/tests/test_java_linter.py +496 -0
autocoder/common/linter_core/tests/test_linters.py +265 -0
autocoder/common/linter_core/tests/test_models.py +81 -0
autocoder/common/linter_core/tests/verify_config_loading.py +296 -0
autocoder/common/linter_core/tests/verify_fixes.py +183 -0
autocoder/common/llm_friendly_package/__init__.py +31 -0
autocoder/common/llm_friendly_package/base_manager.py +102 -0
autocoder/common/llm_friendly_package/docs_manager.py +121 -0
autocoder/common/llm_friendly_package/library_manager.py +171 -0
autocoder/common/{llm_friendly_package.py → llm_friendly_package/main_manager.py} +204 -231
autocoder/common/llm_friendly_package/models.py +40 -0
autocoder/common/llm_friendly_package/test_llm_friendly_package.py +536 -0
autocoder/common/llms/__init__.py +15 -0
autocoder/common/llms/demo_error_handling.py +85 -0
autocoder/common/llms/factory.py +142 -0
autocoder/common/llms/manager.py +264 -0
autocoder/common/llms/pricing.py +121 -0
autocoder/common/llms/registry.py +288 -0
autocoder/common/llms/schema.py +77 -0
autocoder/common/llms/simple_demo.py +45 -0
autocoder/common/llms/test_quick_model.py +116 -0
autocoder/common/llms/test_remove_functionality.py +182 -0
autocoder/common/llms/tests/__init__.py +1 -0
autocoder/common/llms/tests/test_manager.py +330 -0
autocoder/common/llms/tests/test_registry.py +364 -0
autocoder/common/mcp_tools/__init__.py +62 -0
autocoder/common/{mcp_tools.py → mcp_tools/executor.py} +49 -40
autocoder/common/{mcp_hub.py → mcp_tools/hub.py} +42 -68
autocoder/common/{mcp_server_install.py → mcp_tools/installer.py} +16 -28
autocoder/common/{mcp_server.py → mcp_tools/server.py} +176 -48
autocoder/common/mcp_tools/test_keyboard_interrupt.py +93 -0
autocoder/common/mcp_tools/test_mcp_tools.py +391 -0
autocoder/common/{mcp_server_types.py → mcp_tools/types.py} +121 -48
autocoder/common/mcp_tools/verify_functionality.py +202 -0
autocoder/common/model_speed_tester.py +32 -26
autocoder/common/priority_directory_finder/__init__.py +142 -0
autocoder/common/priority_directory_finder/examples.py +230 -0
autocoder/common/priority_directory_finder/finder.py +283 -0
autocoder/common/priority_directory_finder/models.py +236 -0
autocoder/common/priority_directory_finder/test_priority_directory_finder.py +431 -0
autocoder/common/project_scanner/__init__.py +18 -0
autocoder/common/project_scanner/compat.py +77 -0
autocoder/common/project_scanner/scanner.py +436 -0
autocoder/common/project_tracker/__init__.py +27 -0
autocoder/common/project_tracker/api.py +228 -0
autocoder/common/project_tracker/demo.py +272 -0
autocoder/common/project_tracker/tracker.py +487 -0
autocoder/common/project_tracker/types.py +53 -0
autocoder/common/pruner/__init__.py +67 -0
autocoder/common/pruner/agentic_conversation_pruner.py +651 -102
autocoder/common/pruner/conversation_message_ids_api.py +386 -0
autocoder/common/pruner/conversation_message_ids_manager.py +347 -0
autocoder/common/pruner/conversation_message_ids_pruner.py +473 -0
autocoder/common/pruner/conversation_normalizer.py +347 -0
autocoder/common/pruner/conversation_pruner.py +26 -6
autocoder/common/pruner/test_agentic_conversation_pruner.py +554 -112
autocoder/common/pruner/test_conversation_normalizer.py +502 -0
autocoder/common/pruner/test_tool_content_detector.py +324 -0
autocoder/common/pruner/tool_content_detector.py +227 -0
autocoder/common/pruner/tools/__init__.py +18 -0
autocoder/common/pruner/tools/query_message_ids.py +264 -0
autocoder/common/pruner/tools/test_agentic_pruning_logic.py +432 -0
autocoder/common/pruner/tools/test_message_ids_pruning_only.py +192 -0
autocoder/common/pull_requests/__init__.py +9 -1
autocoder/common/pull_requests/utils.py +122 -1
autocoder/common/rag_manager/rag_manager.py +36 -40
autocoder/common/rulefiles/__init__.py +53 -1
autocoder/common/rulefiles/api.py +250 -0
autocoder/common/rulefiles/core/__init__.py +14 -0
autocoder/common/rulefiles/core/manager.py +241 -0
autocoder/common/rulefiles/core/selector.py +805 -0
autocoder/common/rulefiles/models/__init__.py +20 -0
autocoder/common/rulefiles/models/index.py +16 -0
autocoder/common/rulefiles/models/init_rule.py +18 -0
autocoder/common/rulefiles/models/rule_file.py +18 -0
autocoder/common/rulefiles/models/rule_relevance.py +14 -0
autocoder/common/rulefiles/models/summary.py +16 -0
autocoder/common/rulefiles/test_rulefiles.py +776 -0
autocoder/common/rulefiles/utils/__init__.py +34 -0
autocoder/common/rulefiles/utils/monitor.py +86 -0
autocoder/common/rulefiles/utils/parser.py +230 -0
autocoder/common/save_formatted_log.py +67 -10
autocoder/common/search_replace.py +8 -1
autocoder/common/search_replace_patch/__init__.py +24 -0
autocoder/common/search_replace_patch/base.py +115 -0
autocoder/common/search_replace_patch/manager.py +248 -0
autocoder/common/search_replace_patch/patch_replacer.py +304 -0
autocoder/common/search_replace_patch/similarity_replacer.py +306 -0
autocoder/common/search_replace_patch/string_replacer.py +181 -0
autocoder/common/search_replace_patch/tests/__init__.py +3 -0
autocoder/common/search_replace_patch/tests/run_tests.py +126 -0
autocoder/common/search_replace_patch/tests/test_base.py +188 -0
autocoder/common/search_replace_patch/tests/test_empty_line_insert.py +233 -0
autocoder/common/search_replace_patch/tests/test_integration.py +389 -0
autocoder/common/search_replace_patch/tests/test_manager.py +351 -0
autocoder/common/search_replace_patch/tests/test_patch_replacer.py +316 -0
autocoder/common/search_replace_patch/tests/test_regex_replacer.py +306 -0
autocoder/common/search_replace_patch/tests/test_similarity_replacer.py +384 -0
autocoder/common/shell_commands/__init__.py +197 -0
autocoder/common/shell_commands/background_process_notifier.py +346 -0
autocoder/common/shell_commands/command_executor.py +1127 -0
autocoder/common/shell_commands/error_recovery.py +541 -0
autocoder/common/shell_commands/exceptions.py +120 -0
autocoder/common/shell_commands/interactive_executor.py +476 -0
autocoder/common/shell_commands/interactive_pexpect_process.py +623 -0
autocoder/common/shell_commands/interactive_process.py +744 -0
autocoder/common/shell_commands/interactive_session_manager.py +1014 -0
autocoder/common/shell_commands/monitoring.py +529 -0
autocoder/common/shell_commands/process_cleanup.py +386 -0
autocoder/common/shell_commands/process_manager.py +606 -0
autocoder/common/shell_commands/test_interactive_pexpect_process.py +281 -0
autocoder/common/shell_commands/tests/__init__.py +6 -0
autocoder/common/shell_commands/tests/conftest.py +118 -0
autocoder/common/shell_commands/tests/test_background_process_notifier.py +703 -0
autocoder/common/shell_commands/tests/test_command_executor.py +448 -0
autocoder/common/shell_commands/tests/test_error_recovery.py +305 -0
autocoder/common/shell_commands/tests/test_exceptions.py +299 -0
autocoder/common/shell_commands/tests/test_execute_batch.py +588 -0
autocoder/common/shell_commands/tests/test_indented_batch_commands.py +244 -0
autocoder/common/shell_commands/tests/test_integration.py +664 -0
autocoder/common/shell_commands/tests/test_monitoring.py +546 -0
autocoder/common/shell_commands/tests/test_performance.py +632 -0
autocoder/common/shell_commands/tests/test_process_cleanup.py +397 -0
autocoder/common/shell_commands/tests/test_process_manager.py +606 -0
autocoder/common/shell_commands/tests/test_timeout_config.py +343 -0
autocoder/common/shell_commands/tests/test_timeout_manager.py +520 -0
autocoder/common/shell_commands/timeout_config.py +315 -0
autocoder/common/shell_commands/timeout_manager.py +352 -0
autocoder/common/terminal_paste/__init__.py +14 -0
autocoder/common/terminal_paste/demo.py +145 -0
autocoder/common/terminal_paste/demo_paste_functionality.py +95 -0
autocoder/common/terminal_paste/paste_handler.py +200 -0
autocoder/common/terminal_paste/paste_manager.py +118 -0
autocoder/common/terminal_paste/tests/__init__.py +1 -0
autocoder/common/terminal_paste/tests/test_paste_handler.py +182 -0
autocoder/common/terminal_paste/tests/test_paste_manager.py +126 -0
autocoder/common/terminal_paste/utils.py +163 -0
autocoder/common/test_autocoder_args.py +232 -0
autocoder/common/test_env_manager.py +173 -0
autocoder/common/test_env_manager_integration.py +159 -0
autocoder/common/text_similarity/__init__.py +9 -0
autocoder/common/text_similarity/demo.py +216 -0
autocoder/common/text_similarity/examples.py +266 -0
autocoder/common/text_similarity/test_text_similarity.py +306 -0
autocoder/common/text_similarity/text_similarity.py +194 -0
autocoder/common/text_similarity/utils.py +125 -0
autocoder/common/todos/__init__.py +61 -0
autocoder/common/todos/cache/__init__.py +16 -0
autocoder/common/todos/cache/base_cache.py +89 -0
autocoder/common/todos/cache/cache_manager.py +228 -0
autocoder/common/todos/cache/memory_cache.py +225 -0
autocoder/common/todos/config.py +155 -0
autocoder/common/todos/exceptions.py +35 -0
autocoder/common/todos/get_todo_manager.py +161 -0
autocoder/common/todos/manager.py +537 -0
autocoder/common/todos/models.py +239 -0
autocoder/common/todos/storage/__init__.py +14 -0
autocoder/common/todos/storage/base_storage.py +76 -0
autocoder/common/todos/storage/file_storage.py +278 -0
autocoder/common/tokens/counter.py +24 -2
autocoder/common/tools_manager/__init__.py +17 -0
autocoder/common/tools_manager/examples.py +162 -0
autocoder/common/tools_manager/manager.py +385 -0
autocoder/common/tools_manager/models.py +39 -0
autocoder/common/tools_manager/test_tools_manager.py +303 -0
autocoder/common/tools_manager/utils.py +191 -0
autocoder/common/v2/agent/agentic_callbacks.py +270 -0
autocoder/common/v2/agent/agentic_edit.py +2699 -1856
autocoder/common/v2/agent/agentic_edit_change_manager.py +474 -0
autocoder/common/v2/agent/agentic_edit_tools/__init__.py +35 -1
autocoder/common/v2/agent/agentic_edit_tools/ac_mod_list_tool_resolver.py +279 -0
autocoder/common/v2/agent/agentic_edit_tools/ac_mod_write_tool_resolver.py +10 -1
autocoder/common/v2/agent/agentic_edit_tools/background_task_tool_resolver.py +1167 -0
autocoder/common/v2/agent/agentic_edit_tools/base_tool_resolver.py +2 -2
autocoder/common/v2/agent/agentic_edit_tools/conversation_message_ids_read_tool_resolver.py +214 -0
autocoder/common/v2/agent/agentic_edit_tools/conversation_message_ids_write_tool_resolver.py +299 -0
autocoder/common/v2/agent/agentic_edit_tools/count_tokens_tool_resolver.py +290 -0
autocoder/common/v2/agent/agentic_edit_tools/execute_command_tool_resolver.py +564 -29
autocoder/common/v2/agent/agentic_edit_tools/execute_workflow_tool_resolver.py +485 -0
autocoder/common/v2/agent/agentic_edit_tools/extract_to_text_tool_resolver.py +225 -0
autocoder/common/v2/agent/agentic_edit_tools/lint_report.py +79 -0
autocoder/common/v2/agent/agentic_edit_tools/linter_config_models.py +343 -0
autocoder/common/v2/agent/agentic_edit_tools/linter_enabled_tool_resolver.py +189 -0
autocoder/common/v2/agent/agentic_edit_tools/list_files_tool_resolver.py +169 -101
autocoder/common/v2/agent/agentic_edit_tools/load_extra_document_tool_resolver.py +349 -0
autocoder/common/v2/agent/agentic_edit_tools/read_file_tool_resolver.py +243 -50
autocoder/common/v2/agent/agentic_edit_tools/replace_in_file_tool_resolver.py +667 -147
autocoder/common/v2/agent/agentic_edit_tools/run_named_subagents_tool_resolver.py +691 -0
autocoder/common/v2/agent/agentic_edit_tools/search_files_tool_resolver.py +410 -86
autocoder/common/v2/agent/agentic_edit_tools/session_interactive_tool_resolver.py +115 -0
autocoder/common/v2/agent/agentic_edit_tools/session_start_tool_resolver.py +190 -0
autocoder/common/v2/agent/agentic_edit_tools/session_stop_tool_resolver.py +76 -0
autocoder/common/v2/agent/agentic_edit_tools/test_write_to_file_tool_resolver.py +207 -192
autocoder/common/v2/agent/agentic_edit_tools/todo_read_tool_resolver.py +80 -63
autocoder/common/v2/agent/agentic_edit_tools/todo_write_tool_resolver.py +237 -233
autocoder/common/v2/agent/agentic_edit_tools/use_mcp_tool_resolver.py +2 -2
autocoder/common/v2/agent/agentic_edit_tools/web_crawl_tool_resolver.py +557 -0
autocoder/common/v2/agent/agentic_edit_tools/web_search_tool_resolver.py +600 -0
autocoder/common/v2/agent/agentic_edit_tools/write_to_file_tool_resolver.py +56 -121
autocoder/common/v2/agent/agentic_edit_types.py +343 -9
autocoder/common/v2/agent/runner/__init__.py +3 -3
autocoder/common/v2/agent/runner/base_runner.py +12 -26
autocoder/common/v2/agent/runner/{event_runner.py → file_based_event_runner.py} +3 -2
autocoder/common/v2/agent/runner/sdk_runner.py +150 -8
autocoder/common/v2/agent/runner/terminal_runner.py +170 -57
autocoder/common/v2/agent/runner/tool_display.py +557 -159
autocoder/common/v2/agent/test_agentic_callbacks.py +265 -0
autocoder/common/v2/agent/test_agentic_edit.py +194 -0
autocoder/common/v2/agent/tool_caller/__init__.py +24 -0
autocoder/common/v2/agent/tool_caller/default_tool_resolver_map.py +135 -0
autocoder/common/v2/agent/tool_caller/integration_test.py +172 -0
autocoder/common/v2/agent/tool_caller/plugins/__init__.py +14 -0
autocoder/common/v2/agent/tool_caller/plugins/base_plugin.py +126 -0
autocoder/common/v2/agent/tool_caller/plugins/examples/__init__.py +13 -0
autocoder/common/v2/agent/tool_caller/plugins/examples/logging_plugin.py +164 -0
autocoder/common/v2/agent/tool_caller/plugins/examples/security_filter_plugin.py +198 -0
autocoder/common/v2/agent/tool_caller/plugins/plugin_interface.py +141 -0
autocoder/common/v2/agent/tool_caller/test_tool_caller.py +278 -0
autocoder/common/v2/agent/tool_caller/tool_call_plugin_manager.py +331 -0
autocoder/common/v2/agent/tool_caller/tool_caller.py +337 -0
autocoder/common/v2/agent/tool_caller/usage_example.py +193 -0
autocoder/common/v2/code_agentic_editblock_manager.py +4 -4
autocoder/common/v2/code_auto_generate.py +136 -78
autocoder/common/v2/code_auto_generate_diff.py +135 -79
autocoder/common/v2/code_auto_generate_editblock.py +174 -99
autocoder/common/v2/code_auto_generate_strict_diff.py +151 -71
autocoder/common/v2/code_auto_merge.py +1 -1
autocoder/common/v2/code_auto_merge_editblock.py +13 -1
autocoder/common/v2/code_diff_manager.py +3 -3
autocoder/common/v2/code_editblock_manager.py +4 -14
autocoder/common/v2/code_manager.py +1 -1
autocoder/common/v2/code_strict_diff_manager.py +2 -2
autocoder/common/wrap_llm_hint/__init__.py +10 -0
autocoder/common/wrap_llm_hint/test_wrap_llm_hint.py +1067 -0
autocoder/common/wrap_llm_hint/utils.py +432 -0
autocoder/common/wrap_llm_hint/wrap_llm_hint.py +323 -0
autocoder/completer/__init__.py +8 -0
autocoder/completer/command_completer_v2.py +1051 -0
autocoder/default_project/__init__.py +501 -0
autocoder/dispacher/__init__.py +4 -12
autocoder/dispacher/actions/action.py +165 -7
autocoder/dispacher/actions/plugins/action_regex_project.py +2 -2
autocoder/index/entry.py +116 -124
autocoder/{agent → index/filter}/agentic_filter.py +322 -333
autocoder/index/filter/normal_filter.py +5 -11
autocoder/index/filter/quick_filter.py +1 -1
autocoder/index/index.py +36 -9
autocoder/index/tests/__init__.py +1 -0
autocoder/index/tests/run_tests.py +195 -0
autocoder/index/tests/test_entry.py +303 -0
autocoder/index/tests/test_index_manager.py +314 -0
autocoder/index/tests/test_module_integration.py +300 -0
autocoder/index/tests/test_symbols_utils.py +183 -0
autocoder/inner/__init__.py +4 -0
autocoder/inner/agentic.py +932 -0
autocoder/inner/async_command_handler.py +992 -0
autocoder/inner/conversation_command_handlers.py +623 -0
autocoder/inner/merge_command_handler.py +213 -0
autocoder/inner/queue_command_handler.py +684 -0
autocoder/models.py +95 -266
autocoder/plugins/git_helper_plugin.py +31 -29
autocoder/plugins/token_helper_plugin.py +65 -46
autocoder/pyproject/__init__.py +32 -29
autocoder/rag/agentic_rag.py +215 -75
autocoder/rag/cache/simple_cache.py +1 -2
autocoder/rag/loaders/image_loader.py +1 -1
autocoder/rag/long_context_rag.py +42 -26
autocoder/rag/qa_conversation_strategy.py +1 -1
autocoder/rag/terminal/__init__.py +17 -0
autocoder/rag/terminal/args.py +581 -0
autocoder/rag/terminal/bootstrap.py +61 -0
autocoder/rag/terminal/command_handlers.py +653 -0
autocoder/rag/terminal/formatters/__init__.py +20 -0
autocoder/rag/terminal/formatters/base.py +70 -0
autocoder/rag/terminal/formatters/json_format.py +66 -0
autocoder/rag/terminal/formatters/stream_json.py +95 -0
autocoder/rag/terminal/formatters/text.py +28 -0
autocoder/rag/terminal/init.py +120 -0
autocoder/rag/terminal/utils.py +106 -0
autocoder/rag/test_agentic_rag.py +389 -0
autocoder/rag/test_doc_filter.py +3 -3
autocoder/rag/test_long_context_rag.py +1 -1
autocoder/rag/test_token_limiter.py +517 -10
autocoder/rag/token_counter.py +3 -0
autocoder/rag/token_limiter.py +19 -15
autocoder/rag/tools/__init__.py +26 -2
autocoder/rag/tools/bochaai_example.py +343 -0
autocoder/rag/tools/bochaai_sdk.py +541 -0
autocoder/rag/tools/metaso_example.py +268 -0
autocoder/rag/tools/metaso_sdk.py +417 -0
autocoder/rag/tools/recall_tool.py +28 -7
autocoder/rag/tools/run_integration_tests.py +204 -0
autocoder/rag/tools/test_all_providers.py +318 -0
autocoder/rag/tools/test_bochaai_integration.py +482 -0
autocoder/rag/tools/test_final_integration.py +215 -0
autocoder/rag/tools/test_metaso_integration.py +424 -0
autocoder/rag/tools/test_metaso_real.py +171 -0
autocoder/rag/tools/test_web_crawl_tool.py +639 -0
autocoder/rag/tools/test_web_search_tool.py +509 -0
autocoder/rag/tools/todo_read_tool.py +202 -0
autocoder/rag/tools/todo_write_tool.py +412 -0
autocoder/rag/tools/web_crawl_tool.py +634 -0
autocoder/rag/tools/web_search_tool.py +558 -0
autocoder/rag/tools/web_tools_example.py +119 -0
autocoder/rag/types.py +16 -0
autocoder/rag/variable_holder.py +4 -2
autocoder/rags.py +86 -79
autocoder/regexproject/__init__.py +23 -21
autocoder/sdk/__init__.py +46 -190
autocoder/sdk/api.py +370 -0
autocoder/sdk/async_runner/__init__.py +26 -0
autocoder/sdk/async_runner/async_executor.py +650 -0
autocoder/sdk/async_runner/async_handler.py +356 -0
autocoder/sdk/async_runner/markdown_processor.py +595 -0
autocoder/sdk/async_runner/task_metadata.py +284 -0
autocoder/sdk/async_runner/worktree_manager.py +438 -0
autocoder/sdk/cli/__init__.py +2 -5
autocoder/sdk/cli/formatters.py +28 -204
autocoder/sdk/cli/handlers.py +77 -44
autocoder/sdk/cli/main.py +154 -171
autocoder/sdk/cli/options.py +95 -22
autocoder/sdk/constants.py +139 -51
autocoder/sdk/core/auto_coder_core.py +484 -109
autocoder/sdk/core/bridge.py +297 -115
autocoder/sdk/exceptions.py +18 -12
autocoder/sdk/formatters/__init__.py +19 -0
autocoder/sdk/formatters/input.py +64 -0
autocoder/sdk/formatters/output.py +247 -0
autocoder/sdk/formatters/stream.py +54 -0
autocoder/sdk/models/__init__.py +6 -5
autocoder/sdk/models/options.py +55 -18
autocoder/sdk/utils/formatters.py +27 -195
autocoder/suffixproject/__init__.py +28 -25
autocoder/terminal/__init__.py +14 -0
autocoder/terminal/app.py +454 -0
autocoder/terminal/args.py +32 -0
autocoder/terminal/bootstrap.py +178 -0
autocoder/terminal/command_processor.py +521 -0
autocoder/terminal/command_registry.py +57 -0
autocoder/terminal/help.py +97 -0
autocoder/terminal/tasks/__init__.py +5 -0
autocoder/terminal/tasks/background.py +77 -0
autocoder/terminal/tasks/task_event.py +70 -0
autocoder/terminal/ui/__init__.py +13 -0
autocoder/terminal/ui/completer.py +268 -0
autocoder/terminal/ui/keybindings.py +75 -0
autocoder/terminal/ui/session.py +41 -0
autocoder/terminal/ui/toolbar.py +64 -0
autocoder/terminal/utils/__init__.py +13 -0
autocoder/terminal/utils/errors.py +18 -0
autocoder/terminal/utils/paths.py +19 -0
autocoder/terminal/utils/shell.py +43 -0
autocoder/terminal_v3/__init__.py +10 -0
autocoder/terminal_v3/app.py +201 -0
autocoder/terminal_v3/handlers/__init__.py +5 -0
autocoder/terminal_v3/handlers/command_handler.py +131 -0
autocoder/terminal_v3/models/__init__.py +6 -0
autocoder/terminal_v3/models/conversation_buffer.py +214 -0
autocoder/terminal_v3/models/message.py +50 -0
autocoder/terminal_v3/models/tool_display.py +247 -0
autocoder/terminal_v3/ui/__init__.py +7 -0
autocoder/terminal_v3/ui/keybindings.py +56 -0
autocoder/terminal_v3/ui/layout.py +141 -0
autocoder/terminal_v3/ui/styles.py +43 -0
autocoder/tsproject/__init__.py +23 -23
autocoder/utils/auto_coder_utils/chat_stream_out.py +1 -1
autocoder/utils/llms.py +88 -80
autocoder/utils/math_utils.py +101 -0
autocoder/utils/model_provider_selector.py +16 -4
autocoder/utils/operate_config_api.py +33 -5
autocoder/utils/thread_utils.py +2 -2
autocoder/version.py +4 -2
autocoder/workflow_agents/__init__.py +84 -0
autocoder/workflow_agents/agent.py +143 -0
autocoder/workflow_agents/exceptions.py +573 -0
autocoder/workflow_agents/executor.py +489 -0
autocoder/workflow_agents/loader.py +737 -0
autocoder/workflow_agents/runner.py +267 -0
autocoder/workflow_agents/types.py +172 -0
autocoder/workflow_agents/utils.py +434 -0
autocoder/workflow_agents/workflow_manager.py +211 -0
auto_coder-1.0.0.dist-info/METADATA +0 -396
auto_coder-1.0.0.dist-info/RECORD +0 -442
auto_coder-1.0.0.dist-info/licenses/LICENSE +0 -201
autocoder/auto_coder_server.py +0 -672
autocoder/benchmark.py +0 -138
autocoder/common/ac_style_command_parser/example.py +0 -7
autocoder/common/cleaner.py +0 -31
autocoder/common/command_completer_v2.py +0 -615
autocoder/common/context_pruner.py +0 -477
autocoder/common/conversation_pruner.py +0 -132
autocoder/common/directory_cache/__init__.py +0 -1
autocoder/common/directory_cache/cache.py +0 -192
autocoder/common/directory_cache/test_cache.py +0 -190
autocoder/common/file_checkpoint/examples.py +0 -217
autocoder/common/llm_friendly_package_example.py +0 -138
autocoder/common/llm_friendly_package_test.py +0 -63
autocoder/common/pull_requests/test_module.py +0 -1
autocoder/common/rulefiles/autocoderrules_utils.py +0 -484
autocoder/common/text.py +0 -30
autocoder/common/v2/agent/agentic_edit_tools/list_package_info_tool_resolver.py +0 -42
autocoder/common/v2/agent/agentic_edit_tools/test_execute_command_tool_resolver.py +0 -70
autocoder/common/v2/agent/agentic_edit_tools/test_search_files_tool_resolver.py +0 -163
autocoder/common/v2/agent/agentic_tool_display.py +0 -183
autocoder/plugins/dynamic_completion_example.py +0 -148
autocoder/plugins/sample_plugin.py +0 -160
autocoder/sdk/cli/__main__.py +0 -26
autocoder/sdk/cli/completion_wrapper.py +0 -38
autocoder/sdk/cli/install_completion.py +0 -301
autocoder/sdk/models/messages.py +0 -209
autocoder/sdk/session/__init__.py +0 -32
autocoder/sdk/session/session.py +0 -106
autocoder/sdk/session/session_manager.py +0 -56
{auto_coder-1.0.0.dist-info → auto_coder-2.0.0.dist-info}/top_level.txt +0 -0
/autocoder/{sdk/example.py → common/agent_query_queue/__init__.py} +0 -0

autocoder/common/pruner/agentic_conversation_pruner.py CHANGED Viewed

@@ -1,147 +1,370 @@
-from typing import List, Dict, Any, Union
+from typing import List, Dict, Any, Union, Optional
 import json
 import re
-from pydantic import BaseModel
+import copy
 import byzerllm
 from autocoder.common.printer import Printer
-from autocoder.rag.token_counter import count_tokens
+from autocoder.common.tokens import count_string_tokens
 from loguru import logger
 from autocoder.common import AutoCoderArgs
+from autocoder.common.autocoderargs_parser import AutoCoderArgsParser
 from autocoder.common.save_formatted_log import save_formatted_log
+from autocoder.common.wrap_llm_hint.utils import merge_with_last_user_message
+from autocoder.common.conversations.get_conversation_manager import get_conversation_manager
+from .tool_content_detector import ToolContentDetector
+from .conversation_message_ids_api import get_conversation_message_ids_api
+from .conversation_message_ids_pruner import ConversationMessageIdsPruner
-class AgenticPruneStrategy(BaseModel):
-    name: str
-    description: str
-    config: Dict[str, Any] = {"safe_zone_tokens": 0}
 class AgenticConversationPruner:
     """
     Specialized conversation pruner for agentic conversations that cleans up tool outputs.
     This pruner specifically targets tool result messages (role='user', content contains '<tool_result>')
     and replaces their content with a placeholder message to reduce token usage while maintaining
     conversation flow.
     """
-    def __init__(self, args: AutoCoderArgs, llm: Union[byzerllm.ByzerLLM, byzerllm.SimpleByzerLLM]):
+    def __init__(self, args: AutoCoderArgs, llm: Union[byzerllm.ByzerLLM, byzerllm.SimpleByzerLLM, None], conversation_id: Optional[str] = None):
+        if conversation_id is None:
+            raise ValueError("conversation_id is required in AgenticConversationPruner")
         self.args = args
         self.llm = llm
+        self.conversation_id = conversation_id
         self.printer = Printer()
         self.replacement_message = "This message has been cleared. If you still want to get this information, you can call the tool again to retrieve it."
-        self.strategies = {
-            "tool_output_cleanup": AgenticPruneStrategy(
-                name="tool_output_cleanup",
-                description="Clean up tool output results by replacing content with placeholder messages",
-                config={"safe_zone_tokens": self.args.conversation_prune_safe_zone_tokens}
-            )
+        # Initialize AutoCoderArgs parser for flexible parameter parsing
+        self.args_parser = AutoCoderArgsParser()
+        # Initialize tool content detector
+        self.tool_content_detector = ToolContentDetector(
+            replacement_message="Content cleared to save tokens"
+        )
+        # Initialize message IDs-based pruning components
+        self.message_ids_api = get_conversation_message_ids_api()
+        self.message_ids_pruner = ConversationMessageIdsPruner()
+        # Track pruning statistics
+        self.pruning_stats = {
+            "range_pruning_applied": False,
+            "range_pruning_success": False,
+            "original_length": 0,
+            "after_range_pruning": 0,
+            "after_tool_cleanup": 0,
+            "total_compression_ratio": 1.0
         }
-    def get_available_strategies(self) -> List[Dict[str, Any]]:
-        """Get all available pruning strategies"""
-        return [strategy.model_dump() for strategy in self.strategies.values()]
+    def _get_current_conversation_id(self) -> str:
+        """
+        Get the current conversation ID from the constructor parameter.
-    def prune_conversations(self, conversations: List[Dict[str, Any]],
-                            strategy_name: str = "tool_output_cleanup") -> List[Dict[str, Any]]:
+        Returns:
+            Current conversation ID (guaranteed to be not None)
         """
-        Prune conversations by cleaning up tool outputs.
+        return self.conversation_id
+    def _get_parsed_safe_zone_tokens(self) -> int:
+        """
+        解析 conversation_prune_safe_zone_tokens 参数，支持多种格式
+        Returns:
+            解析后的 token 数量
+        """
+        # 添加调试信息
+        raw_value = self.args.conversation_prune_safe_zone_tokens
+        code_model = self.args.code_model or self.args.model
+        result = self.args_parser.parse_conversation_prune_safe_zone_tokens(
+            raw_value,
+            code_model
+        )
+        # 防护逻辑：如果结果为 0，使用默认值
+        if result == 0:
+            default_value = 50 * 1024
+            print(f"[WARNING] conversation_prune_safe_zone_tokens 为 0，使用默认值: {default_value}")
+            return default_value
+        return result
+    def prune_conversations(self, conversations: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        """
+        Prune conversations by applying range-based pruning first, then cleaning up tool outputs and tool call content.
         Args:
             conversations: Original conversation list
-            strategy_name: Strategy name
         Returns:
             Pruned conversation list
-        """
-        safe_zone_tokens = self.args.conversation_prune_safe_zone_tokens
-        current_tokens = count_tokens(json.dumps(conversations, ensure_ascii=False))
+        """
+        safe_zone_tokens = self._get_parsed_safe_zone_tokens()
+        # print(f"safe_zone_tokens: {safe_zone_tokens}")
+        # 保存原始conversations的深拷贝，用于最终对比分析
+        # original_conversations = copy.deepcopy(conversations)
+        original_length = len(conversations)
+        # Initialize pruning statistics
+        self.pruning_stats["original_length"] = original_length
+        current_tokens = count_string_tokens(
+            json.dumps(conversations, ensure_ascii=False))
         if current_tokens <= safe_zone_tokens:
+            # Update stats for no pruning needed
+            self.pruning_stats.update({
+                "after_range_pruning": original_length,
+                "after_tool_cleanup": original_length,
+                "total_compression_ratio": 1.0
+            })
             return conversations
-        strategy = self.strategies.get(strategy_name, self.strategies["tool_output_cleanup"])
-        if strategy.name == "tool_output_cleanup":
-            return self._tool_output_cleanup_prune(conversations, strategy.config)
-        else:
-            logger.warning(f"Unknown strategy: {strategy_name}, using tool_output_cleanup instead")
-            return self._tool_output_cleanup_prune(conversations, strategy.config)
+        # Step 1: Apply message ids pruning if conversation_id is provided
+        processed_conversations = self._apply_message_ids_pruning(
+            conversations)
+        logger.info(
+            f"After Message IDs pruning: {len(conversations)} -> {len(processed_conversations)} messages")
+        # Check if we're within safe zone after range pruning
+        current_tokens = count_string_tokens(json.dumps(
+            processed_conversations, ensure_ascii=False))
+        # Step 2: Apply tool cleanup if still needed
+        if current_tokens > safe_zone_tokens:
+            config = {"safe_zone_tokens": safe_zone_tokens}
+            processed_conversations = self._unified_tool_cleanup_prune(
+                processed_conversations, config)
+        # Update final statistics
+        final_length = len(processed_conversations)
+        self.pruning_stats["after_tool_cleanup"] = final_length
+        self.pruning_stats["total_compression_ratio"] = final_length / \
+            original_length if original_length > 0 else 1.0
+        # Log overall pruning results
+        logger.info(f"Complete pruning: {original_length} -> {final_length} messages "
+                    f"(total compression: {self.pruning_stats['total_compression_ratio']:.2%})")
+        # if the processed_conversations is still too long, we should add a user message to ask the LLM to clean up the conversation
+        final_tokens = count_string_tokens(json.dumps(
+            processed_conversations, ensure_ascii=False))
+        if final_tokens > safe_zone_tokens:
+            cleanup_message = "The conversation is still too long, please use conversation_message_ids_write tool to save the message ids to be deleted."
-    def _tool_output_cleanup_prune(self, conversations: List[Dict[str, Any]],
-                                   config: Dict[str, Any]) -> List[Dict[str, Any]]:
+            # Use standardized hint merging from wrap_llm_hint module
+            processed_conversations = merge_with_last_user_message(
+                processed_conversations, cleanup_message)
+        # 执行裁剪前后对比分析并记录到日志
+        # self._compare_and_log_conversations(original_conversations, processed_conversations)
+        save_formatted_log(self.args.source_dir, json.dumps(processed_conversations, ensure_ascii=False),
+                           "agentic_pruned_conversation", conversation_id=self._get_current_conversation_id())
+        return processed_conversations
+    def _apply_message_ids_pruning(self, conversations: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
         """
-        Clean up tool outputs by replacing their content with placeholder messages.
+        Apply message IDs-based pruning if conversation_id is provided and message IDs configuration exists.
+        Args:
+            conversations: Original conversation list
+        Returns:
+            Conversations after message IDs pruning (or original if no message IDs config)
+        """
+        # Check if we have conversation_id and message IDs configuration
+        conversation_id = self._get_current_conversation_id()
+        if not conversation_id:
+            logger.debug(
+                "No conversation_id provided, skipping message IDs pruning")
+            self.pruning_stats["after_range_pruning"] = len(conversations)
+            return conversations
+        # Get message IDs configuration for this conversation
+        conversation_message_ids = self.message_ids_api.get_conversation_message_ids(
+            conversation_id)
+        if not conversation_message_ids:
+            logger.debug(
+                f"No message IDs configuration found for conversation {conversation_id}, skipping message IDs pruning")
+            self.pruning_stats["after_range_pruning"] = len(conversations)
+            return conversations
+        # Apply message IDs pruning
+        logger.info(
+            f"Applying message IDs pruning for conversation {conversation_id}")
+        self.pruning_stats["range_pruning_applied"] = True
+        try:
+            pruning_result = self.message_ids_pruner.prune_conversations(
+                conversations, conversation_message_ids)
+            logger.info(f"Message IDs: {pruning_result}")
+            if pruning_result.success:
+                self.pruning_stats["range_pruning_success"] = True
+                self.pruning_stats["after_range_pruning"] = pruning_result.pruned_length
+                # Log message IDs pruning results
+                logger.info(f"Message IDs pruning completed: {pruning_result.original_length} -> {pruning_result.pruned_length} messages "
+                            f"(message IDs compression: {pruning_result.compression_ratio:.2%})")
+                # Log warnings if any
+                if pruning_result.warnings:
+                    for warning in pruning_result.warnings:
+                        logger.warning(f"Message IDs pruning: {warning}")
+                return pruning_result.pruned_conversations
+            else:
+                # Message IDs pruning failed, log error and continue with original conversations
+                logger.error(
+                    f"Message IDs pruning failed: {pruning_result.error_message}")
+                self.pruning_stats["after_range_pruning"] = len(conversations)
+                return conversations
+        except Exception as e:
+            logger.error(
+                f"Message IDs pruning failed with exception: {str(e)}")
+            self.pruning_stats["after_range_pruning"] = len(conversations)
+            return conversations
+    def _unified_tool_cleanup_prune(self, conversations: List[Dict[str, Any]],
+                                    config: Dict[str, Any]) -> List[Dict[str, Any]]:
+        """
+        Clean up both tool output results and tool call content in a unified process.
         This method:
-        1. Identifies tool result messages (role='user' with '<tool_result' in content)
-        2. Starts from the first tool output and progressively cleans them
-        3. Stops when token count is within safe zone
+        1. Identifies both tool result messages (role='user' with '<tool_result' in content)
+           and assistant messages containing tool calls with large content
+        2. Processes all cleanable messages in order, prioritizing tool results first
+        3. Stops when token count is within safe zone OR when less than 6 unpruned messages remain
         """
-        safe_zone_tokens = config.get("safe_zone_tokens", 50 * 1024)
-        processed_conversations = conversations.copy()
-        # Find all tool result message indices
-        tool_result_indices = []
+        safe_zone_tokens = config.get("safe_zone_tokens", 80 * 1024)
+        # 使用深拷贝避免修改原始数据
+        processed_conversations = copy.deepcopy(conversations)
+        # 预先计算初始 token 数量，避免在循环中引用未定义的变量
+        current_tokens = count_string_tokens(json.dumps(
+            processed_conversations, ensure_ascii=False))
+        # Find all cleanable message indices with their types
+        cleanable_messages = []
+        # Find both tool result messages and tool call messages in one loop
         for i, conv in enumerate(processed_conversations):
-            if (conv.get("role") == "user" and
-                isinstance(conv.get("content"), str) and
-                self._is_tool_result_message(conv.get("content", ""))):
-                tool_result_indices.append(i)
-        logger.info(f"Found {len(tool_result_indices)} tool result messages to potentially clean")
-        # Clean tool outputs one by one, starting from the first one
-        for tool_index in tool_result_indices:
-            current_tokens = count_tokens(json.dumps(processed_conversations, ensure_ascii=False))
+            content = conv.get("content", "")
+            role = conv.get("role")
+            if isinstance(content, str):
+                # Check for tool result messages (user role)
+                if (role == "user" and self._is_tool_result_message(content)):
+                    cleanable_messages.append(
+                        {"index": i, "type": "tool_result"})
+                # Check for assistant messages with tool calls
+                elif (role == "assistant" and self.tool_content_detector.is_tool_call_content(content)):
+                    cleanable_messages.append(
+                        {"index": i, "type": "tool_call"})
+        # Sort by index to process in order, but prioritize tool_result messages
+        cleanable_messages.sort(key=lambda x: (
+            x["index"], x["type"] != "tool_result"))
+        logger.info(f"Found {len([m for m in cleanable_messages if m['type'] == 'tool_result'])} tool result messages "
+                    f"and {len([m for m in cleanable_messages if m['type'] == 'tool_call'])} tool call messages to potentially clean")
+        # Track cleaned messages
+        cleaned_count = 0
+        # Clean messages one by one
+        for i, message_info in enumerate(cleanable_messages):
+            # 更新当前 token 数量
+            current_tokens = count_string_tokens(json.dumps(
+                processed_conversations, ensure_ascii=False))
+            # 检查停止条件
+            # 1. Token数已经在安全区域内
             if current_tokens <= safe_zone_tokens:
-                logger.info(f"Token count ({current_tokens}) is within safe zone ({safe_zone_tokens}), stopping cleanup")
+                logger.info(
+                    f"Token count ({current_tokens}) is within safe zone ({safe_zone_tokens}), stopping cleanup")
                 break
-            # Extract tool name for a more specific replacement message
-            tool_name = self._extract_tool_name(processed_conversations[tool_index]["content"])
-            replacement_content = self._generate_replacement_message(tool_name)
-            # Replace the content
-            original_content = processed_conversations[tool_index]["content"]
-            processed_conversations[tool_index]["content"] = replacement_content
-            logger.info(f"Cleaned tool result at index {tool_index} (tool: {tool_name}), "
-                       f"reduced from {len(original_content)} to {len(replacement_content)} characters")
-        final_tokens = count_tokens(json.dumps(processed_conversations, ensure_ascii=False))
-        logger.info(f"Cleanup completed. Token count: {current_tokens} -> {final_tokens}")
-        save_formatted_log(self.args.source_dir, json.dumps(conversations, ensure_ascii=False), "agentic_pruned_conversation")
+            # 2. 剩余未裁剪的对话少于6段
+            remaining_unpruned = len(
+                cleanable_messages) - (i + 1)  # i+1 因为i是从0开始的索引
+            if remaining_unpruned < 6:
+                logger.info(
+                    f"Less than 6 unpruned messages remaining ({remaining_unpruned}), stopping cleanup")
+                break
+            msg_index = message_info["index"]
+            msg_type = message_info["type"]
+            original_content = processed_conversations[msg_index]["content"]
+            if msg_type == "tool_result":
+                # Handle tool result cleanup
+                tool_name = self._extract_tool_name(original_content)
+                replacement_content = self._generate_replacement_message(
+                    tool_name)
+                processed_conversations[msg_index]["content"] = replacement_content
+                cleaned_count += 1
+                logger.info(f"Cleaned tool result at index {msg_index} (tool: {tool_name}), "
+                            f"reduced from {len(original_content)} to {len(replacement_content)} characters")
+            elif msg_type == "tool_call":
+                # Handle tool call content cleanup
+                tool_info = self.tool_content_detector.detect_tool_call(
+                    original_content)
+                if tool_info:
+                    new_content, replaced = self.tool_content_detector.replace_tool_content(
+                        original_content, max_content_length=500
+                    )
+                    if replaced:
+                        processed_conversations[msg_index]["content"] = new_content
+                        cleaned_count += 1
+                        logger.info(f"Cleaned tool call content at index {msg_index} (tool: {tool_info['tool_name']}), "
+                                    f"reduced from {len(original_content)} to {len(new_content)} characters")
+        final_tokens = count_string_tokens(json.dumps(
+            processed_conversations, ensure_ascii=False))
+        initial_tokens = count_string_tokens(
+            json.dumps(conversations, ensure_ascii=False))
+        logger.info(
+            f"Unified tool cleanup completed. Cleaned {cleaned_count} messages. Token count: {initial_tokens} -> {final_tokens}")
         return processed_conversations
     def _is_tool_result_message(self, content: str) -> bool:
         """
         Check if a message content contains tool result XML.
         Args:
             content: Message content to check
         Returns:
             True if content contains tool result format
         """
+        if content is None:
+            return False
         return "<tool_result" in content and "tool_name=" in content
     def _extract_tool_name(self, content: str) -> str:
         """
         Extract tool name from tool result XML content.
         Args:
             content: Tool result XML content
         Returns:
             Tool name or 'unknown' if not found
         """
         # Pattern to match: <tool_result tool_name='...' or <tool_result tool_name="..."
-        pattern = r"<tool_result[^>]*tool_name=['\"]([^'\"]+)['\"]"
+        pattern = r"<tool_result[^>]*tool_name=['\"]([^'\"]*)['\"]"
         match = re.search(pattern, content)
         if match:
             return match.group(1)
         return "unknown"
@@ -149,49 +372,375 @@ class AgenticConversationPruner:
     def _generate_replacement_message(self, tool_name: str) -> str:
         """
         Generate a replacement message for a cleaned tool result.
         Args:
             tool_name: Name of the tool that was called
         Returns:
             Replacement message string
         """
         if tool_name and tool_name != "unknown":
             return (f"<tool_result tool_name='{tool_name}' success='true'>"
-                   f"<message>Content cleared to save tokens</message>"
-                   f"<content>{self.replacement_message}</content>"
-                   f"</tool_result>")
+                    f"<message>Content cleared to save tokens</message>"
+                    f"<content>{self.replacement_message}</content>"
+                    f"</tool_result>")
         else:
             return f"<tool_result success='true'><message>[Content cleared to save tokens, you can call the tool again to get the tool result.]</message><content>{self.replacement_message}</content></tool_result>"
-    def get_cleanup_statistics(self, original_conversations: List[Dict[str, Any]],
-                              pruned_conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
+    def get_cleanup_statistics(self, original_conversations: List[Dict[str, Any]],
+                               pruned_conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
         """
         Get statistics about the cleanup process.
         Args:
             original_conversations: Original conversation list
             pruned_conversations: Pruned conversation list
         Returns:
             Dictionary with cleanup statistics
         """
-        original_tokens = count_tokens(json.dumps(original_conversations, ensure_ascii=False))
-        pruned_tokens = count_tokens(json.dumps(pruned_conversations, ensure_ascii=False))
+        original_tokens = count_string_tokens(
+            json.dumps(original_conversations, ensure_ascii=False))
+        pruned_tokens = count_string_tokens(
+            json.dumps(pruned_conversations, ensure_ascii=False))
         # Count cleaned tool results
-        cleaned_count = 0
+        tool_results_cleaned = 0
+        tool_calls_cleaned = 0
         for orig, pruned in zip(original_conversations, pruned_conversations):
-            if (orig.get("role") == "user" and
-                self._is_tool_result_message(orig.get("content", "")) and
-                orig.get("content") != pruned.get("content")):
-                cleaned_count += 1
+            if orig.get("content") != pruned.get("content"):
+                # Check if it's a tool result message (user role)
+                if (orig.get("role") == "user" and
+                        self._is_tool_result_message(orig.get("content", ""))):
+                    tool_results_cleaned += 1
+                # Check if it's a tool call message (assistant role)
+                elif (orig.get("role") == "assistant" and
+                      self.tool_content_detector.is_tool_call_content(orig.get("content", ""))):
+                    tool_calls_cleaned += 1
         return {
             "original_tokens": original_tokens,
             "pruned_tokens": pruned_tokens,
             "tokens_saved": original_tokens - pruned_tokens,
             "compression_ratio": pruned_tokens / original_tokens if original_tokens > 0 else 1.0,
-            "tool_results_cleaned": cleaned_count,
+            "tool_results_cleaned": tool_results_cleaned,
+            "tool_calls_cleaned": tool_calls_cleaned,
             "total_messages": len(original_conversations)
-        }
+        }
+    def get_pruning_statistics(self) -> Dict[str, Any]:
+        """
+        Get comprehensive pruning statistics including both range and tool cleanup.
+        Returns:
+            Dictionary with complete pruning statistics
+        """
+        return {
+            "range_pruning": {
+                "applied": self.pruning_stats["range_pruning_applied"],
+                "success": self.pruning_stats["range_pruning_success"],
+                "conversation_id": self._get_current_conversation_id()
+            },
+            "message_counts": {
+                "original": self.pruning_stats["original_length"],
+                "after_range_pruning": self.pruning_stats["after_range_pruning"],
+                "after_tool_cleanup": self.pruning_stats["after_tool_cleanup"]
+            },
+            "compression": {
+                "range_pruning_ratio": (
+                    self.pruning_stats["after_range_pruning"] /
+                    self.pruning_stats["original_length"]
+                    if self.pruning_stats["original_length"] > 0 else 1.0
+                ),
+                "tool_cleanup_ratio": (
+                    self.pruning_stats["after_tool_cleanup"] /
+                    self.pruning_stats["after_range_pruning"]
+                    if self.pruning_stats["after_range_pruning"] > 0 else 1.0
+                ),
+                "total_compression_ratio": self.pruning_stats["total_compression_ratio"]
+            },
+            "messages_removed": {
+                "by_range_pruning": (
+                    self.pruning_stats["original_length"] -
+                    self.pruning_stats["after_range_pruning"]
+                ),
+                "by_tool_cleanup": (
+                    self.pruning_stats["after_range_pruning"] -
+                    self.pruning_stats["after_tool_cleanup"]
+                ),
+                "total_removed": (
+                    self.pruning_stats["original_length"] -
+                    self.pruning_stats["after_tool_cleanup"]
+                )
+            }
+        }
+    def _compare_and_log_conversations(self, original_conversations: List[Dict[str, Any]],
+                                       pruned_conversations: List[Dict[str, Any]]) -> None:
+        """
+        独立的方法：对比裁剪前后的conversations，生成详细的对比报告并记录到日志中。
+        Args:
+            original_conversations: 裁剪前的对话列表
+            pruned_conversations: 裁剪后的对话列表
+        """
+        try:
+            # 生成对比分析报告
+            comparison_report = self._generate_comparison_report(
+                original_conversations, pruned_conversations)
+            # 记录详细的对比日志
+            logger.info("=== 对话裁剪前后对比分析 ===")
+            logger.info(
+                f"原始对话数量: {comparison_report['message_counts']['original']}")
+            logger.info(
+                f"裁剪后对话数量: {comparison_report['message_counts']['final']}")
+            logger.info(
+                f"删除的对话数量: {comparison_report['message_counts']['removed']}")
+            logger.info(
+                f"消息压缩比: {comparison_report['compression']['message_compression_ratio']:.2%}")
+            logger.info(
+                f"Token压缩比: {comparison_report['compression']['token_compression_ratio']:.2%}")
+            logger.info(f"Token节省数量: {comparison_report['tokens']['saved']:,}")
+            if comparison_report['changes']['tool_results_modified'] > 0:
+                logger.info(
+                    f"工具结果消息清理数量: {comparison_report['changes']['tool_results_modified']}")
+            if comparison_report['changes']['tool_calls_modified'] > 0:
+                logger.info(
+                    f"工具调用内容清理数量: {comparison_report['changes']['tool_calls_modified']}")
+            if comparison_report['changes']['messages_removed_by_ids'] > 0:
+                logger.info(
+                    f"基于消息ID删除的消息数量: {comparison_report['changes']['messages_removed_by_ids']}")
+            # 保存详细的对比报告到文件日志
+            save_formatted_log(
+                self.args.source_dir,
+                json.dumps(comparison_report, ensure_ascii=False, indent=2),
+                "conversation_comparison_report",
+                conversation_id=self._get_current_conversation_id()
+            )
+        except Exception as e:
+            logger.error(f"生成对话对比报告时出错: {str(e)}")
+            logger.exception(e)
+    def _generate_comparison_report(self, original_conversations: List[Dict[str, Any]],
+                                    pruned_conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
+        """
+        生成详细的对比分析报告。
+        Args:
+            original_conversations: 裁剪前的对话列表
+            pruned_conversations: 裁剪后的对话列表
+        Returns:
+            包含详细对比信息的字典
+        """
+        # 基础统计信息
+        original_count = len(original_conversations)
+        pruned_count = len(pruned_conversations)
+        removed_count = original_count - pruned_count
+        # Token统计
+        original_tokens = count_string_tokens(
+            json.dumps(original_conversations, ensure_ascii=False))
+        pruned_tokens = count_string_tokens(
+            json.dumps(pruned_conversations, ensure_ascii=False))
+        tokens_saved = original_tokens - pruned_tokens
+        # 分析变化详情
+        changes_analysis = self._analyze_conversation_changes(
+            original_conversations, pruned_conversations)
+        # 分析消息类型分布
+        original_distribution = self._analyze_message_distribution(
+            original_conversations)
+        pruned_distribution = self._analyze_message_distribution(
+            pruned_conversations)
+        # 生成完整的对比报告
+        report = {
+            "timestamp": str(__import__("datetime").datetime.now()),
+            "conversation_id": self._get_current_conversation_id(),
+            "pruning_strategy": {
+                "range_pruning_applied": self.pruning_stats["range_pruning_applied"],
+                "tool_cleanup_applied": True,
+                "safe_zone_tokens": self._get_parsed_safe_zone_tokens()
+            },
+            "message_counts": {
+                "original": original_count,
+                "final": pruned_count,
+                "removed": removed_count,
+                "after_range_pruning": self.pruning_stats.get("after_range_pruning", original_count)
+            },
+            "tokens": {
+                "original": original_tokens,
+                "final": pruned_tokens,
+                "saved": tokens_saved,
+                "safe_zone_limit": self._get_parsed_safe_zone_tokens()
+            },
+            "compression": {
+                "message_compression_ratio": pruned_count / original_count if original_count > 0 else 1.0,
+                "token_compression_ratio": pruned_tokens / original_tokens if original_tokens > 0 else 1.0,
+                "range_pruning_compression": (
+                    self.pruning_stats.get(
+                        "after_range_pruning", original_count) / original_count
+                    if original_count > 0 else 1.0
+                ),
+                "tool_cleanup_compression": (
+                    pruned_count /
+                    self.pruning_stats.get(
+                        "after_range_pruning", original_count)
+                    if self.pruning_stats.get("after_range_pruning", original_count) > 0 else 1.0
+                )
+            },
+            "changes": {
+                "messages_removed_by_ids": (
+                    original_count -
+                    self.pruning_stats.get(
+                        "after_range_pruning", original_count)
+                ),
+                "tool_results_modified": changes_analysis["tool_results_modified"],
+                "tool_calls_modified": changes_analysis["tool_calls_modified"],
+                "content_modifications": changes_analysis["content_modifications"],
+                "unchanged_messages": changes_analysis["unchanged_messages"]
+            },
+            "message_distribution": {
+                "original": original_distribution,
+                "pruned": pruned_distribution
+            },
+            "detailed_changes": changes_analysis["detailed_changes"],
+            "pruning_effectiveness": {
+                "tokens_per_message_before": original_tokens / original_count if original_count > 0 else 0,
+                "tokens_per_message_after": pruned_tokens / pruned_count if pruned_count > 0 else 0,
+                "average_token_reduction_per_message": tokens_saved / original_count if original_count > 0 else 0,
+                "within_safe_zone": pruned_tokens <= self._get_parsed_safe_zone_tokens()
+            }
+        }
+        return report
+    def _analyze_conversation_changes(self, original_conversations: List[Dict[str, Any]],
+                                      pruned_conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
+        """
+        分析对话变化的详细信息。
+        Args:
+            original_conversations: 原始对话列表
+            pruned_conversations: 裁剪后对话列表
+        Returns:
+            包含变化分析的字典
+        """
+        tool_results_modified = 0
+        tool_calls_modified = 0
+        content_modifications = 0
+        unchanged_messages = 0
+        detailed_changes = []
+        # 创建一个映射来匹配原始和裁剪后的消息
+        min_length = min(len(original_conversations),
+                         len(pruned_conversations))
+        for i in range(min_length):
+            original_msg = original_conversations[i]
+            pruned_msg = pruned_conversations[i]
+            original_content = original_msg.get("content", "")
+            pruned_content = pruned_msg.get("content", "")
+            if original_content != pruned_content:
+                content_modifications += 1
+                # 分析修改类型
+                change_type = "content_modified"
+                tool_name = None
+                if (original_msg.get("role") == "user" and
+                        self._is_tool_result_message(original_content)):
+                    tool_results_modified += 1
+                    change_type = "tool_result_cleaned"
+                    tool_name = self._extract_tool_name(original_content)
+                elif (original_msg.get("role") == "assistant" and
+                      self.tool_content_detector.is_tool_call_content(original_content)):
+                    tool_calls_modified += 1
+                    change_type = "tool_call_cleaned"
+                    tool_info = self.tool_content_detector.detect_tool_call(
+                        original_content)
+                    tool_name = tool_info.get(
+                        "tool_name") if tool_info else "unknown"
+                detailed_changes.append({
+                    "message_index": i,
+                    "role": original_msg.get("role"),
+                    "change_type": change_type,
+                    "tool_name": tool_name,
+                    "original_length": len(original_content),
+                    "pruned_length": len(pruned_content),
+                    "size_reduction": len(original_content) - len(pruned_content)
+                })
+            else:
+                unchanged_messages += 1
+        return {
+            "tool_results_modified": tool_results_modified,
+            "tool_calls_modified": tool_calls_modified,
+            "content_modifications": content_modifications,
+            "unchanged_messages": unchanged_messages,
+            "detailed_changes": detailed_changes
+        }
+    def _analyze_message_distribution(self, conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
+        """
+        分析消息的角色分布和类型分布。
+        Args:
+            conversations: 对话列表
+        Returns:
+            包含分布信息的字典
+        """
+        role_counts = {"user": 0, "assistant": 0, "system": 0, "other": 0}
+        message_types = {
+            "tool_result": 0,
+            "tool_call": 0,
+            "regular_user": 0,
+            "regular_assistant": 0,
+            "system": 0
+        }
+        for msg in conversations:
+            role = msg.get("role", "other")
+            content = msg.get("content", "")
+            # 统计角色分布
+            if role in role_counts:
+                role_counts[role] += 1
+            else:
+                role_counts["other"] += 1
+            # 统计消息类型分布
+            if role == "system":
+                message_types["system"] += 1
+            elif role == "user":
+                if self._is_tool_result_message(content):
+                    message_types["tool_result"] += 1
+                else:
+                    message_types["regular_user"] += 1
+            elif role == "assistant":
+                if self.tool_content_detector.is_tool_call_content(content):
+                    message_types["tool_call"] += 1
+                else:
+                    message_types["regular_assistant"] += 1
+        return {
+            "total_messages": len(conversations),
+            "role_distribution": role_counts,
+            "message_type_distribution": message_types
+        }

auto-coder 1.0.0__py3-none-any.whl → 2.0.0__py3-none-any.whl

Potentially problematic release.

auto-coder 1.0.0py3-none-any.whl → 2.0.0py3-none-any.whl