PyPI - pdd-cli - Versions diffs - 0.0.20__py3-none-any.whl → 0.0.21__py3-none-any.whl - Mend

pdd-cli 0.0.20py3-none-any.whl → 0.0.21py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of pdd-cli might be problematic. Click here for more details.

Files changed (20) hide show

pdd/cli.py +1 -1
pdd/context_generator.py +1 -1
pdd/data/llm_model.csv +1 -1
pdd/edit_file.py +783 -0
pdd/fix_error_loop.py +218 -66
pdd/fix_errors_from_unit_tests.py +366 -206
pdd/fix_main.py +25 -6
pdd/increase_tests.py +6 -3
pdd/mcp_config.json +7 -0
pdd/preprocess.py +0 -26
pdd/prompts/fix_errors_from_unit_tests_LLM.prompt +2 -2
pdd/prompts/generate_test_LLM.prompt +11 -4
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/METADATA +5 -4
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/RECORD +18 -18
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/WHEEL +1 -1
pdd/preprocess copy.py +0 -234
pdd/preprocess_copy_bahrat.py +0 -287
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/entry_points.txt +0 -0
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/licenses/LICENSE +0 -0
{pdd_cli-0.0.20.dist-info → pdd_cli-0.0.21.dist-info}/top_level.txt +0 -0

pdd/fix_error_loop.py CHANGED Viewed

@@ -3,12 +3,8 @@ import os
 import sys
 import subprocess
 import shutil
-from datetime import datetime
 import json
-# Added for the new pytest-based reporting:
-# import pytest
-# import io
+from datetime import datetime
 from rich import print as rprint
 from rich.console import Console
@@ -59,6 +55,46 @@ def run_pytest_on_file(test_file: str) -> (int, int, int, str):
     except Exception as e:
         return 1, 1, 0, f"Error running pytest: {str(e)}"
+def format_log_for_output(log_structure):
+    """
+    Format the structured log into a human-readable text format with XML tags.
+    """
+    formatted_text = ""
+    # Initial test output (only for first iteration)
+    if log_structure["iterations"] and "initial_test_output" in log_structure["iterations"][0]:
+        formatted_text += f"<pytest_output iteration=1>\n"
+        formatted_text += f"{log_structure['iterations'][0]['initial_test_output']}\n"
+        formatted_text += f"</pytest_output>\n\n"
+    for i, iteration in enumerate(log_structure["iterations"]):
+        formatted_text += f"=== Attempt iteration {iteration['number']} ===\n\n"
+        # Fix attempt with XML tags
+        if iteration.get("fix_attempt"):
+            formatted_text += f"<fix_attempt iteration={iteration['number']}>\n"
+            formatted_text += f"{iteration['fix_attempt']}\n"
+            formatted_text += f"</fix_attempt>\n\n"
+        # Verification with XML tags
+        if iteration.get("verification"):
+            formatted_text += f"<verification_output iteration={iteration['number']}>\n"
+            formatted_text += f"{iteration['verification']}\n"
+            formatted_text += f"</verification_output>\n\n"
+        # Post-fix test results (except for last iteration to avoid duplication)
+        if i < len(log_structure["iterations"]) - 1 and iteration.get("post_test_output"):
+            formatted_text += f"<pytest_output iteration={iteration['number']+1}>\n"
+            formatted_text += f"{iteration['post_test_output']}\n"
+            formatted_text += f"</pytest_output>\n\n"
+    # Final run (using last iteration's post-test output)
+    if log_structure["iterations"] and log_structure["iterations"][-1].get("post_test_output"):
+        formatted_text += f"=== Final Pytest Run ===\n"
+        formatted_text += f"{log_structure['iterations'][-1]['post_test_output']}\n"
+    return formatted_text
 def fix_error_loop(unit_test_file: str,
                    code_file: str,
                    prompt: str,
@@ -75,7 +111,7 @@ def fix_error_loop(unit_test_file: str,
     The tests are re-run in the same iteration after a fix to see if we've succeeded,
     so that 'attempts' matches the number of fix attempts (not the total test runs).
-    This updated version uses pytest's API directly to retrieve failures, errors, and warnings.
+    This updated version uses structured logging to avoid redundant entries.
     Inputs:
         unit_test_file: Path to the file containing unit tests.
@@ -117,10 +153,18 @@ def fix_error_loop(unit_test_file: str,
             rprint(f"[red]Error:[/red] Could not remove error log file: {e}")
             return False, "", "", 0, 0.0, ""
+    # Initialize structured log
+    log_structure = {
+        "iterations": []
+    }
     # We use fix_attempts to track how many times we actually call the LLM:
     fix_attempts = 0
     total_cost = 0.0
     model_name = ""
+    # Initialize these variables now
+    final_unit_test = ""
+    final_code = ""
     best_iteration_info = {
         "attempt": None,
         "fails": sys.maxsize,
@@ -137,38 +181,96 @@ def fix_error_loop(unit_test_file: str,
     iteration = 0
     # Run an initial test to determine starting state
     try:
-        fails, errors, warnings, pytest_output = run_pytest_on_file(unit_test_file)
+        initial_fails, initial_errors, initial_warnings, pytest_output = run_pytest_on_file(unit_test_file)
+        # Store initial state for statistics
+        stats = {
+            "initial_fails": initial_fails,
+            "initial_errors": initial_errors,
+            "initial_warnings": initial_warnings,
+            "final_fails": 0,  # Initialize to 0
+            "final_errors": 0,  # Initialize to 0
+            "final_warnings": 0,  # Initialize to 0
+            "best_iteration": None,
+            "iterations_info": []
+        }
     except Exception as e:
         rprint(f"[red]Error running initial pytest:[/red] {e}")
         return False, "", "", fix_attempts, total_cost, model_name
+    fails, errors, warnings = initial_fails, initial_errors, initial_warnings
+    # Determine success state immediately
+    success = (fails == 0 and errors == 0 and warnings == 0)
+    # Track if tests were initially passing
+    initially_passing = success
     while fix_attempts < max_attempts and total_cost < budget:
         iteration += 1
-        # Append to error log:
-        with open(error_log_file, "a") as elog:
-            elog.write(f"<pytest_output iteration={iteration}>\n")
-            elog.write(pytest_output + "\n")
-            elog.write("</pytest_output>\n")
+        # Add this iteration to the structured log
+        if iteration == 1:
+            # For first iteration, include the initial test output
+            iteration_data = {
+                "number": iteration,
+                "initial_test_output": pytest_output,
+                "fix_attempt": None,
+                "verification": None,
+                "post_test_output": None
+            }
+        else:
+            # For subsequent iterations, don't duplicate test output
+            iteration_data = {
+                "number": iteration,
+                "fix_attempt": None,
+                "verification": None,
+                "post_test_output": None
+            }
+        log_structure["iterations"].append(iteration_data)
         # If tests pass initially, no need to fix anything
-        if fails == 0 and errors == 0 and warnings == 0:
-            rprint("[green]All tests already pass with no warnings! No fixes needed.[/green]")
-            return True, "", "", 0, 0.0, ""
+        if success:
+            rprint("[green]All tests already pass with no warnings! No fixes needed on this iteration.[/green]")
+            stats["final_fails"] = 0  # Explicitly set to 0
+            stats["final_errors"] = 0  # Explicitly set to 0
+            stats["final_warnings"] = 0  # Explicitly set to 0
+            stats["best_iteration"] = 0
+            # Update structured log
+            log_structure["iterations"][-1]["post_test_output"] = pytest_output
+            # Write formatted log to file
+            with open(error_log_file, "w") as elog:
+                elog.write(format_log_for_output(log_structure))
+            # Set success to True (already determined)
+            # No need to read the files - keep empty strings for passing cases
+            break
         iteration_header = f"=== Attempt iteration {iteration} ==="
         rprint(f"[bold blue]{iteration_header}[/bold blue]")
-        with open(error_log_file, "a") as elog:
-            elog.write(f"\n{iteration_header}\n\n")
-            elog.write(f"<fix_attempt iteration={iteration}>\n")
         # Print to console (escaped):
         rprint(f"[magenta]Pytest output:[/magenta]\n{escape_brackets(pytest_output)}")
         if verbose:
             rprint(f"[cyan]Iteration summary: {fails} failed, {errors} errors, {warnings} warnings[/cyan]")
+        # Track this iteration's stats
+        iteration_stats = {
+            "iteration": iteration,
+            "fails": fails,
+            "errors": errors,
+            "warnings": warnings
+        }
+        stats["iterations_info"].append(iteration_stats)
         # If tests are fully successful, we break out:
         if fails == 0 and errors == 0 and warnings == 0:
             rprint("[green]All tests passed with no warnings! Exiting loop.[/green]")
+            success = True  # Set success flag
+            stats["final_fails"] = 0  # Explicitly set to 0
+            stats["final_errors"] = 0  # Explicitly set to 0
+            stats["final_warnings"] = 0  # Explicitly set to 0
             break
         # We only attempt to fix if test is failing or has warnings:
@@ -218,20 +320,22 @@ def fix_error_loop(unit_test_file: str,
         # Call fix:
         try:
-            # Read error log file into pytest_output so it has history of all previous attempts:
-            with open(error_log_file, "r") as f:
-                pytest_output = f.read()
-            updated_unit_test, updated_code, fixed_unit_test, fixed_code, cost, model_name = fix_errors_from_unit_tests(
+            # Format the log for the LLM
+            formatted_log = format_log_for_output(log_structure)
+            updated_unit_test, updated_code, fixed_unit_test, fixed_code, analysis, cost, model_name = fix_errors_from_unit_tests(
                 unit_test_contents,
                 code_contents,
                 prompt,
-                pytest_output,
+                formatted_log,  # Use formatted log instead of reading the file
                 error_log_file,
                 strength,
                 temperature,
                 verbose=verbose
             )
+            # Update the fix attempt in the structured log
+            log_structure["iterations"][-1]["fix_attempt"] = analysis
         except Exception as e:
             rprint(f"[red]Error during fix_errors_from_unit_tests call:[/red] {e}")
             break
@@ -247,8 +351,10 @@ def fix_error_loop(unit_test_file: str,
         # Update unit test file if needed.
         if updated_unit_test:
             try:
+                # Ensure we have valid content even if the returned fixed_unit_test is empty
+                content_to_write = fixed_unit_test if fixed_unit_test else unit_test_contents
                 with open(unit_test_file, "w") as f:
-                    f.write(fixed_unit_test)
+                    f.write(content_to_write)
                 if verbose:
                     rprint("[green]Unit test file updated.[/green]")
             except Exception as e:
@@ -258,8 +364,10 @@ def fix_error_loop(unit_test_file: str,
         # Update code file and run verification if needed.
         if updated_code:
             try:
+                # Ensure we have valid content even if the returned fixed_code is empty
+                content_to_write = fixed_code if fixed_code else code_contents
                 with open(code_file, "w") as f:
-                    f.write(fixed_code)
+                    f.write(content_to_write)
                 if verbose:
                     rprint("[green]Code file updated.[/green]")
             except Exception as e:
@@ -274,15 +382,13 @@ def fix_error_loop(unit_test_file: str,
                 verify_stdout = verify_result.stdout or ""
                 verify_stderr = verify_result.stderr or ""
                 verify_output = verify_stdout + "\n" + verify_stderr
+                # Update verification in structured log
+                log_structure["iterations"][-1]["verification"] = verify_output
             except Exception as e:
                 rprint(f"[red]Error running verification program:[/red] {e}")
                 verify_output = f"Verification program error: {e}"
-            with open(error_log_file, "a") as elog:
-                elog.write(f"</fix_attempt>\n\n")
-                elog.write(f"\n[Verification attempt at iteration {iteration}]\n<verification_output iteration={iteration}>\n")
-                elog.write(verify_output )
-                elog.write("</verification_output>\n")
+                log_structure["iterations"][-1]["verification"] = verify_output
             rprint(f"[blue]Verification program output:[/blue]\n{escape_brackets(verify_output)}")
@@ -290,8 +396,7 @@ def fix_error_loop(unit_test_file: str,
                 rprint("[red]Verification failed. Restoring last working code file from backup.[/red]")
                 try:
                     shutil.copy(code_backup, code_file)
-                    with open(error_log_file, "a") as elog:
-                        elog.write(f"Restored code file from backup: {code_backup}, because verification program failed to run.\n")
+                    log_structure["iterations"][-1]["verification"] += f"\nRestored code file from backup: {code_backup}, because verification program failed to run."
                 except Exception as e:
                     rprint(f"[red]Error restoring backup code file:[/red] {e}")
                     break
@@ -299,34 +404,45 @@ def fix_error_loop(unit_test_file: str,
         # Run pytest for the next iteration
         try:
             fails, errors, warnings, pytest_output = run_pytest_on_file(unit_test_file)
+            # Update post-test output in structured log
+            log_structure["iterations"][-1]["post_test_output"] = pytest_output
+            # Write updated structured log to file after each iteration
+            with open(error_log_file, "w") as elog:
+                elog.write(format_log_for_output(log_structure))
+            # Update iteration stats with post-fix results
+            stats["iterations_info"][-1].update({
+                "post_fix_fails": fails,
+                "post_fix_errors": errors,
+                "post_fix_warnings": warnings,
+                "improved": (fails < iteration_stats["fails"] or
+                            errors < iteration_stats["errors"] or
+                            warnings < iteration_stats["warnings"])
+            })
+            # Update success status based on latest results
+            success = (fails == 0 and errors == 0 and warnings == 0)
+            # Update final stats
+            stats["final_fails"] = fails
+            stats["final_errors"] = errors
+            stats["final_warnings"] = warnings
         except Exception as e:
             rprint(f"[red]Error running pytest for next iteration:[/red] {e}")
             return False, "", "", fix_attempts, total_cost, model_name
-    # Final test run:
-    try:
-        final_fails, final_errors, final_warnings, final_output = run_pytest_on_file(unit_test_file)
-    except Exception as e:
-        rprint(f"[red]Error running final pytest:[/red] {e}")
-        final_output = f"Error: {e}"
-        final_fails = final_errors = final_warnings = sys.maxsize
-    with open(error_log_file, "a") as elog:
-        elog.write("\n=== Final Pytest Run ===\n")
-        elog.write(final_output + "\n")
-    rprint(f"[blue]Final pytest output:[/blue]\n{escape_brackets(final_output)}")
     # Possibly restore best iteration if the final run is not as good:
-    if best_iteration_info["attempt"] is not None:
+    if best_iteration_info["attempt"] is not None and not success:
         is_better_final = False
-        if final_errors < best_iteration_info["errors"]:
+        if stats["final_errors"] < best_iteration_info["errors"]:
             is_better_final = True
-        elif final_errors == best_iteration_info["errors"] and final_fails < best_iteration_info["fails"]:
+        elif stats["final_errors"] == best_iteration_info["errors"] and stats["final_fails"] < best_iteration_info["fails"]:
             is_better_final = True
-        elif (final_errors == best_iteration_info["errors"] and
-              final_fails == best_iteration_info["fails"] and
-              final_warnings < best_iteration_info["warnings"]):
+        elif (stats["final_errors"] == best_iteration_info["errors"] and
+              stats["final_fails"] == best_iteration_info["fails"] and
+              stats["final_warnings"] < best_iteration_info["warnings"]):
             is_better_final = True
         if not is_better_final:
@@ -338,24 +454,61 @@ def fix_error_loop(unit_test_file: str,
                     shutil.copy(best_iteration_info["unit_test_backup"], unit_test_file)
                 if best_iteration_info["code_backup"]:
                     shutil.copy(best_iteration_info["code_backup"], code_file)
+                # Update final stats with best iteration stats
+                stats["final_fails"] = best_iteration_info["fails"]
+                stats["final_errors"] = best_iteration_info["errors"]
+                stats["final_warnings"] = best_iteration_info["warnings"]
+                stats["best_iteration"] = best_iteration_info["attempt"]
+                # Check if the best iteration had passing tests
+                success = (best_iteration_info["fails"] == 0 and
+                          best_iteration_info["errors"] == 0 and
+                          best_iteration_info["warnings"] == 0)
             except Exception as e:
                 rprint(f"[red]Error restoring best iteration backups:[/red] {e}")
+        else:
+            # Current iteration is the best
+            stats["best_iteration"] = "final"
+    else:
+        stats["best_iteration"] = "final"
-    # Read final file contents
+    # Read final file contents, but only if tests weren't initially passing
+    # For initially passing tests, keep empty strings as required by the test
     try:
-        with open(unit_test_file, "r") as f:
-            final_unit_test = f.read()
-        with open(code_file, "r") as f:
-            final_code = f.read()
+        if not initially_passing:
+            with open(unit_test_file, "r") as f:
+                final_unit_test = f.read()
+            with open(code_file, "r") as f:
+                final_code = f.read()
     except Exception as e:
         rprint(f"[red]Error reading final files:[/red] {e}")
         final_unit_test, final_code = "", ""
-    success = (final_fails == 0 and final_errors == 0 and final_warnings == 0)
-    if success:
-        rprint("[green]Final tests passed with no warnings.[/green]")
-    else:
-        rprint("[red]Final tests still failing or producing warnings.[/red]")
+    # Check if we broke out early because tests already passed
+    if stats["best_iteration"] == 0 and fix_attempts == 0:
+        # Still return at least 1 attempt to acknowledge the work done
+        fix_attempts = 1
+    # Print summary statistics
+    rprint("\n[bold cyan]Summary Statistics:[/bold cyan]")
+    rprint(f"Initial state: {initial_fails} fails, {initial_errors} errors, {initial_warnings} warnings")
+    rprint(f"Final state: {stats['final_fails']} fails, {stats['final_errors']} errors, {stats['final_warnings']} warnings")
+    rprint(f"Best iteration: {stats['best_iteration']}")
+    rprint(f"Success: {success}")
+    # Calculate improvements
+    stats["improvement"] = {
+        "fails_reduced": initial_fails - stats["final_fails"],
+        "errors_reduced": initial_errors - stats["final_errors"],
+        "warnings_reduced": initial_warnings - stats["final_warnings"],
+        "percent_improvement": 100 if initial_fails + initial_errors + initial_warnings == 0 else
+                              (1 - (stats["final_fails"] + stats["final_errors"] + stats["final_warnings"]) /
+                                   (initial_fails + initial_errors + initial_warnings)) * 100
+    }
+    rprint(f"Improvement: {stats['improvement']['fails_reduced']} fails, {stats['improvement']['errors_reduced']} errors, {stats['improvement']['warnings_reduced']} warnings")
+    rprint(f"Overall improvement: {stats['improvement']['percent_improvement']:.2f}%")
     return success, final_unit_test, final_code, fix_attempts, total_cost, model_name
@@ -391,5 +544,4 @@ if __name__ == "__main__":
     rprint(f"Attempts: {attempts}")
     rprint(f"Total cost: ${total_cost:.6f}")
     rprint(f"Model used: {model_name}")
-    rprint(f"Final unit test contents:\n{final_unit_test}")
-    rprint(f"Final code contents:\n{final_code}")
+    rprint(f"Final unit test contents:\n{final_unit_test}")

pdd-cli 0.0.20__py3-none-any.whl → 0.0.21__py3-none-any.whl

Potentially problematic release.

pdd-cli 0.0.20py3-none-any.whl → 0.0.21py3-none-any.whl