PyPI - auto-coder - Versions diffs - 0.1.270__py3-none-any.whl → 0.1.272__py3-none-any.whl - Mend

auto-coder 0.1.270py3-none-any.whl → 0.1.272py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of auto-coder might be problematic. Click here for more details.

Files changed (22) hide show

{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/METADATA +2 -2
{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/RECORD +22 -21
autocoder/auto_coder_runner.py +4 -4
autocoder/commands/auto_command.py +33 -5
autocoder/commands/tools.py +28 -15
autocoder/common/auto_coder_lang.py +7 -3
autocoder/common/auto_configure.py +1 -1
autocoder/common/command_generator.py +3 -1
autocoder/common/files.py +44 -10
autocoder/common/shells.py +68 -0
autocoder/index/filter/quick_filter.py +4 -3
autocoder/rag/doc_filter.py +165 -59
autocoder/rag/llm_wrapper.py +3 -1
autocoder/rag/long_context_rag.py +196 -51
autocoder/rag/relevant_utils.py +12 -1
autocoder/rag/token_limiter.py +159 -18
autocoder/rag/token_limiter_utils.py +13 -0
autocoder/version.py +1 -1
{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/LICENSE +0 -0
{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/WHEEL +0 -0
{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/entry_points.txt +0 -0
{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/top_level.txt +0 -0

autocoder/rag/relevant_utils.py CHANGED Viewed

@@ -1,7 +1,7 @@
 from autocoder.common import AutoCoderArgs, SourceCode
 from pydantic import BaseModel
 import re
-from typing import Optional
+from typing import Optional, List
 class DocRelevance(BaseModel):
@@ -23,6 +23,17 @@ class FilterDoc(BaseModel):
     task_timing: TaskTiming
+class DocFilterResult(BaseModel):
+    # 注意， docs 只保留最后成功过滤的文档
+    docs: List[FilterDoc]
+    # 注意， raw_docs 保留所有文档
+    raw_docs: List[FilterDoc]
+    input_tokens_counts: List[int]
+    generated_tokens_counts: List[int]
+    durations: List[float]
+    model_name: str = "unknown"
 def parse_relevance(text: Optional[str]) -> Optional[DocRelevance]:
     if text is None:
         return None

autocoder/rag/token_limiter.py CHANGED Viewed

@@ -7,7 +7,9 @@ from autocoder.common import SourceCode
 from byzerllm.utils.client.code_utils import extract_code
 import byzerllm
 from byzerllm import ByzerLLM
+from autocoder.rag.relevant_utils import TaskTiming
+from byzerllm import MetaHolder
+from autocoder.rag.token_limiter_utils import TokenLimiterResult
 class TokenLimiter:
     def __init__(
@@ -94,10 +96,24 @@ class TokenLimiter:
         relevant_docs: List[SourceCode],
         conversations: List[Dict[str, str]],
         index_filter_workers: int,
-    ) -> List[SourceCode]:
+    ) -> TokenLimiterResult:
+        logger.info(f"=== TokenLimiter Starting ===")
+        logger.info(f"Configuration: full_text_limit={self.full_text_limit}, segment_limit={self.segment_limit}, buff_limit={self.buff_limit}")
+        logger.info(f"Processing {len(relevant_docs)} source code documents")
+        start_time = time.time()
         final_relevant_docs = []
         token_count = 0
         doc_num_count = 0
+        model_name = self.chunk_llm.default_model_name or "unknown"
+        token_limiter_result = TokenLimiterResult(
+                docs=[],
+                raw_docs=[],
+                input_tokens_counts=[],
+                generated_tokens_counts=[],
+                durations=[],
+                model_name=model_name
+            )
         reorder_relevant_docs = []
@@ -112,6 +128,7 @@ class TokenLimiter:
         ## TODO:
         ##     1. 未来根据参数决定是否开启重排以及重排的策略
         if not self.disable_segment_reorder:
+            logger.info("Document reordering enabled - organizing segments by original document order")
             num_count = 0
             for doc in relevant_docs:
                 num_count += 1
@@ -135,8 +152,11 @@ class TokenLimiter:
                     temp_docs.sort(key=lambda x: x.metadata["chunk_index"])
                     reorder_relevant_docs.extend(temp_docs)
         else:
+            logger.info("Document reordering disabled - using original retrieval order")
             reorder_relevant_docs = relevant_docs
+        logger.info(f"After reordering: {len(reorder_relevant_docs)} documents to process")
         ## 非窗口分区实现
         for doc in reorder_relevant_docs:
             doc_tokens = self.count_tokens(doc.source_code)
@@ -149,10 +169,15 @@ class TokenLimiter:
         ## 如果窗口无法放下所有的相关文档，则需要分区
         if len(final_relevant_docs) < len(reorder_relevant_docs):
+            logger.info(f"Token limit exceeded: {len(final_relevant_docs)}/{len(reorder_relevant_docs)} docs fit in window")
+            logger.info(f"=== Starting First Round: Full Text Loading ===")
             ## 先填充full_text分区
             token_count = 0
             new_token_limit = self.full_text_limit
             doc_num_count = 0
+            first_round_start_time = time.time()
             for doc in reorder_relevant_docs:
                 doc_tokens = self.count_tokens(doc.source_code)
                 doc_num_count += 1
@@ -161,11 +186,18 @@ class TokenLimiter:
                     token_count += doc_tokens
                 else:
                     break
+            first_round_duration = time.time() - first_round_start_time
+            logger.info(
+                f"First round complete: loaded {len(self.first_round_full_docs)} documents"
+                f" ({token_count} tokens) in {first_round_duration:.2f}s"
+            )
             if len(self.first_round_full_docs) > 0:
                 remaining_tokens = (
                     self.full_text_limit + self.segment_limit - token_count
                 )
+                logger.info(f"Remaining token budget: {remaining_tokens}")
             else:
                 logger.warning(
                     "Full text area is empty, this is may caused by the single doc is too long"
@@ -175,49 +207,117 @@ class TokenLimiter:
             ## 继续填充segment分区
             sencond_round_start_time = time.time()
             remaining_docs = reorder_relevant_docs[len(self.first_round_full_docs) :]
             logger.info(
-                f"first round docs: {len(self.first_round_full_docs)} remaining docs: {len(remaining_docs)} index_filter_workers: {index_filter_workers}"
+                f"=== Starting Second Round: Chunk Extraction ==="
+                f"\n  * Documents to process: {len(remaining_docs)}"
+                f"\n  * Remaining token budget: {remaining_tokens}"
+                f"\n  * Thread pool size: {index_filter_workers or 5}"
             )
+            total_processed = 0
+            successful_extractions = 0
             with ThreadPoolExecutor(max_workers=index_filter_workers or 5) as executor:
-                future_to_doc = {
-                    executor.submit(self.process_range_doc, doc, conversations): doc
-                    for doc in remaining_docs
-                }
+                future_to_doc = {}
+                for doc in remaining_docs:
+                    submit_time = time.time()
+                    future = executor.submit(self.process_range_doc, doc, conversations)
+                    future_to_doc[future] = (doc, submit_time)
                 for future in as_completed(future_to_doc):
-                    doc = future_to_doc[future]
+                    doc, submit_time = future_to_doc[future]
+                    end_time = time.time()
+                    total_processed += 1
+                    progress_percent = (total_processed / len(remaining_docs)) * 100
                     try:
                         result = future.result()
+                        task_duration = end_time - submit_time
                         if result and remaining_tokens > 0:
                             self.second_round_extracted_docs.append(result)
+                            token_limiter_result.raw_docs.append(result)
+                            if "rag" in result.metadata and "chunk" in result.metadata["rag"]:
+                                chunk_meta = result.metadata["rag"]["chunk"]
+                                token_limiter_result.input_tokens_counts.append(chunk_meta.get("input_tokens_count", 0))
+                                token_limiter_result.generated_tokens_counts.append(chunk_meta.get("generated_tokens_count", 0))
+                                token_limiter_result.durations.append(chunk_meta.get("duration", 0))
                             tokens = result.tokens
+                            successful_extractions += 1
+                            logger.info(
+                                f"Document extraction [{progress_percent:.1f}%] - {total_processed}/{len(remaining_docs)}:"
+                                f"\n  - File: {doc.module_name}"
+                                f"\n  - Chunks: {len(result.metadata.get('chunk_ranges', []))}"
+                                f"\n  - Extracted tokens: {tokens}"
+                                f"\n  - Remaining tokens: {remaining_tokens - tokens if tokens > 0 else remaining_tokens}"
+                                f"\n  - Processing time: {task_duration:.2f}s"
+                            )
                             if tokens > 0:
                                 remaining_tokens -= tokens
                             else:
                                 logger.warning(
                                     f"Token count for doc {doc.module_name} is 0 or negative"
                                 )
+                        elif result:
+                            logger.info(
+                                f"Document extraction [{progress_percent:.1f}%] - {total_processed}/{len(remaining_docs)}:"
+                                f"\n  - File: {doc.module_name}"
+                                f"\n  - Skipped: Token budget exhausted ({remaining_tokens} remaining)"
+                                f"\n  - Processing time: {task_duration:.2f}s"
+                            )
+                        else:
+                            logger.warning(
+                                f"Document extraction [{progress_percent:.1f}%] - {total_processed}/{len(remaining_docs)}:"
+                                f"\n  - File: {doc.module_name}"
+                                f"\n  - Result: No content extracted"
+                                f"\n  - Processing time: {task_duration:.2f}s"
+                            )
                     except Exception as exc:
                         logger.error(
-                            f"Processing doc {doc.module_name} generated an exception: {exc}"
+                            f"Document extraction [{progress_percent:.1f}%] - {total_processed}/{len(remaining_docs)}:"
+                            f"\n  - File: {doc.module_name}"
+                            f"\n  - Error: {exc}"
+                            f"\n  - Processing time: {end_time - submit_time:.2f}s"
                         )
             final_relevant_docs = (
                 self.first_round_full_docs + self.second_round_extracted_docs
             )
             self.sencond_round_time = time.time() - sencond_round_start_time
+            total_time = time.time() - start_time
             logger.info(
-                f"Second round processing time: {self.sencond_round_time:.2f} seconds"
+                f"=== Second round complete ==="
+                f"\n  * Time: {self.sencond_round_time:.2f}s"
+                f"\n  * Documents processed: {total_processed}/{len(remaining_docs)}"
+                f"\n  * Successful extractions: {successful_extractions}"
+                f"\n  * Extracted tokens: {sum(doc.tokens for doc in self.second_round_extracted_docs)}"
             )
-        return final_relevant_docs
+        else:
+            logger.info(f"All {len(reorder_relevant_docs)} documents fit within token limits")
+            total_time = time.time() - start_time
+        logger.info(
+            f"=== TokenLimiter Complete ==="
+            f"\n  * Total time: {total_time:.2f}s"
+            f"\n  * Documents selected: {len(final_relevant_docs)}/{len(relevant_docs)}"
+            f"\n  * Total tokens: {sum(doc.tokens for doc in final_relevant_docs)}"
+        )
+        token_limiter_result.docs = final_relevant_docs
+        return token_limiter_result
     def process_range_doc(
         self, doc: SourceCode, conversations: List[Dict[str, str]], max_retries=3
     ) -> SourceCode:
         for attempt in range(max_retries):
             content = ""
+            start_time = time.time()
             try:
                 source_code_with_line_number = ""
                 source_code_lines = doc.source_code.split("\n")
@@ -225,14 +325,19 @@ class TokenLimiter:
                     source_code_with_line_number += f"{idx+1} {line}\n"
                 llm = self.chunk_llm
+                model_name = llm.default_model_name or "unknown"
+                meta_holder = MetaHolder()
+                extraction_start_time = time.time()
                 extracted_info = (
                     self.extract_relevance_range_from_docs_with_conversation.options(
                         {"llm_config": {"max_length": 100}}
                     )
-                    .with_llm(llm)
+                    .with_llm(llm).with_meta(meta_holder)
                     .run(conversations, [source_code_with_line_number])
                 )
+                extraction_duration = time.time() - extraction_start_time
                 json_str = extract_code(extracted_info)[0][1]
                 json_objs = json.loads(json_str)
@@ -242,23 +347,59 @@ class TokenLimiter:
                     chunk = "\n".join(source_code_lines[start_line:end_line])
                     content += chunk + "\n"
+                total_duration = time.time() - start_time
+                meta = meta_holder.get_meta_model()
+                input_tokens_count = 0
+                generated_tokens_count = 0
+                if meta:
+                    input_tokens_count = meta.input_tokens_count
+                    generated_tokens_count = meta.generated_tokens_count
+                logger.debug(
+                    f"Document {doc.module_name} chunk extraction details:"
+                    f"\n  - Chunks found: {len(json_objs)}"
+                    f"\n  - Input tokens: {input_tokens_count}"
+                    f"\n  - Generated tokens: {generated_tokens_count}"
+                    f"\n  - LLM time: {extraction_duration:.2f}s"
+                    f"\n  - Total processing time: {total_duration:.2f}s"
+                )
+                if "rag" not in doc.metadata:
+                    doc.metadata["rag"] = {}
+                doc.metadata["rag"]["chunk"] = {
+                    "original_doc": doc.module_name,
+                    "chunk_ranges": json_objs,
+                    "processing_time": total_duration,
+                    "llm_time": extraction_duration,
+                    "input_tokens_count": input_tokens_count,
+                    "generated_tokens_count": generated_tokens_count,
+                    "duration": extraction_duration,
+                    "chunk_model":model_name
+                }
                 return SourceCode(
                     module_name=doc.module_name,
                     source_code=content.strip(),
-                    tokens=self.count_tokens(content),
+                    tokens=input_tokens_count + generated_tokens_count,
                     metadata={
-                        "original_doc": doc.module_name,
-                        "chunk_ranges": json_objs,
+                        **doc.metadata
                     },
                 )
             except Exception as e:
+                err_duration = time.time() - start_time
                 if attempt < max_retries - 1:
                     logger.warning(
-                        f"Error processing doc {doc.module_name}, retrying... (Attempt {attempt + 1}) Error: {str(e)}"
+                        f"Error processing doc {doc.module_name}, retrying... (Attempt {attempt + 1}) Error: {str(e)}, duration: {err_duration:.2f}s"
                     )
                 else:
                     logger.error(
-                        f"Failed to process doc {doc.module_name} after {max_retries} attempts: {str(e)}"
+                        f"Failed to process doc {doc.module_name} after {max_retries} attempts: {str(e)}, total duration: {err_duration:.2f}s"
                     )
                     return SourceCode(
                         module_name=doc.module_name, source_code="", tokens=0

autocoder/rag/token_limiter_utils.py ADDED Viewed

@@ -0,0 +1,13 @@
+import pydantic
+from typing import List
+from autocoder.common import SourceCode
+class TokenLimiterResult(pydantic.BaseModel):
+    # 注意， docs 只保留结果文档
+    docs: List[SourceCode]
+    # 注意， raw_docs 保留所有文档
+    raw_docs: List[SourceCode]
+    input_tokens_counts: List[int]
+    generated_tokens_counts: List[int]
+    durations: List[float]
+    model_name: str = "unknown"

autocoder/version.py CHANGED Viewed

	@@ -1 +1 @@
1	- __version__ = "0.1.~~270~~"
1	+ __version__ = "0.1.272"

{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/LICENSE RENAMED Viewed

File without changes

{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/WHEEL RENAMED Viewed

File without changes

{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{auto_coder-0.1.270.dist-info → auto_coder-0.1.272.dist-info}/top_level.txt RENAMED Viewed

File without changes

auto-coder 0.1.270__py3-none-any.whl → 0.1.272__py3-none-any.whl

Potentially problematic release.

auto-coder 0.1.270py3-none-any.whl → 0.1.272py3-none-any.whl