PyPI - gitflow-analytics - Versions diffs - 1.0.3__py3-none-any.whl → 1.3.6__py3-none-any.whl - Mend

gitflow-analytics 1.0.3py3-none-any.whl → 1.3.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (116) hide show

gitflow_analytics/_version.py +1 -1
gitflow_analytics/classification/__init__.py +31 -0
gitflow_analytics/classification/batch_classifier.py +752 -0
gitflow_analytics/classification/classifier.py +464 -0
gitflow_analytics/classification/feature_extractor.py +725 -0
gitflow_analytics/classification/linguist_analyzer.py +574 -0
gitflow_analytics/classification/model.py +455 -0
gitflow_analytics/cli.py +4108 -350
gitflow_analytics/cli_rich.py +198 -48
gitflow_analytics/config/__init__.py +43 -0
gitflow_analytics/config/errors.py +261 -0
gitflow_analytics/config/loader.py +904 -0
gitflow_analytics/config/profiles.py +264 -0
gitflow_analytics/config/repository.py +124 -0
gitflow_analytics/config/schema.py +441 -0
gitflow_analytics/config/validator.py +154 -0
gitflow_analytics/config.py +44 -508
gitflow_analytics/core/analyzer.py +1209 -98
gitflow_analytics/core/cache.py +1337 -29
gitflow_analytics/core/data_fetcher.py +1193 -0
gitflow_analytics/core/identity.py +363 -14
gitflow_analytics/core/metrics_storage.py +526 -0
gitflow_analytics/core/progress.py +372 -0
gitflow_analytics/core/schema_version.py +269 -0
gitflow_analytics/extractors/ml_tickets.py +1100 -0
gitflow_analytics/extractors/story_points.py +8 -1
gitflow_analytics/extractors/tickets.py +749 -11
gitflow_analytics/identity_llm/__init__.py +6 -0
gitflow_analytics/identity_llm/analysis_pass.py +231 -0
gitflow_analytics/identity_llm/analyzer.py +464 -0
gitflow_analytics/identity_llm/models.py +76 -0
gitflow_analytics/integrations/github_integration.py +175 -11
gitflow_analytics/integrations/jira_integration.py +461 -24
gitflow_analytics/integrations/orchestrator.py +124 -1
gitflow_analytics/metrics/activity_scoring.py +322 -0
gitflow_analytics/metrics/branch_health.py +470 -0
gitflow_analytics/metrics/dora.py +379 -20
gitflow_analytics/models/database.py +843 -53
gitflow_analytics/pm_framework/__init__.py +115 -0
gitflow_analytics/pm_framework/adapters/__init__.py +50 -0
gitflow_analytics/pm_framework/adapters/jira_adapter.py +1845 -0
gitflow_analytics/pm_framework/base.py +406 -0
gitflow_analytics/pm_framework/models.py +211 -0
gitflow_analytics/pm_framework/orchestrator.py +652 -0
gitflow_analytics/pm_framework/registry.py +333 -0
gitflow_analytics/qualitative/__init__.py +9 -10
gitflow_analytics/qualitative/chatgpt_analyzer.py +259 -0
gitflow_analytics/qualitative/classifiers/__init__.py +3 -3
gitflow_analytics/qualitative/classifiers/change_type.py +518 -244
gitflow_analytics/qualitative/classifiers/domain_classifier.py +272 -165
gitflow_analytics/qualitative/classifiers/intent_analyzer.py +321 -222
gitflow_analytics/qualitative/classifiers/llm/__init__.py +35 -0
gitflow_analytics/qualitative/classifiers/llm/base.py +193 -0
gitflow_analytics/qualitative/classifiers/llm/batch_processor.py +383 -0
gitflow_analytics/qualitative/classifiers/llm/cache.py +479 -0
gitflow_analytics/qualitative/classifiers/llm/cost_tracker.py +435 -0
gitflow_analytics/qualitative/classifiers/llm/openai_client.py +403 -0
gitflow_analytics/qualitative/classifiers/llm/prompts.py +373 -0
gitflow_analytics/qualitative/classifiers/llm/response_parser.py +287 -0
gitflow_analytics/qualitative/classifiers/llm_commit_classifier.py +607 -0
gitflow_analytics/qualitative/classifiers/risk_analyzer.py +215 -189
gitflow_analytics/qualitative/core/__init__.py +4 -4
gitflow_analytics/qualitative/core/llm_fallback.py +239 -235
gitflow_analytics/qualitative/core/nlp_engine.py +157 -148
gitflow_analytics/qualitative/core/pattern_cache.py +214 -192
gitflow_analytics/qualitative/core/processor.py +381 -248
gitflow_analytics/qualitative/enhanced_analyzer.py +2236 -0
gitflow_analytics/qualitative/example_enhanced_usage.py +420 -0
gitflow_analytics/qualitative/models/__init__.py +7 -7
gitflow_analytics/qualitative/models/schemas.py +155 -121
gitflow_analytics/qualitative/utils/__init__.py +4 -4
gitflow_analytics/qualitative/utils/batch_processor.py +136 -123
gitflow_analytics/qualitative/utils/cost_tracker.py +142 -140
gitflow_analytics/qualitative/utils/metrics.py +172 -158
gitflow_analytics/qualitative/utils/text_processing.py +146 -104
gitflow_analytics/reports/__init__.py +100 -0
gitflow_analytics/reports/analytics_writer.py +539 -14
gitflow_analytics/reports/base.py +648 -0
gitflow_analytics/reports/branch_health_writer.py +322 -0
gitflow_analytics/reports/classification_writer.py +924 -0
gitflow_analytics/reports/cli_integration.py +427 -0
gitflow_analytics/reports/csv_writer.py +1676 -212
gitflow_analytics/reports/data_models.py +504 -0
gitflow_analytics/reports/database_report_generator.py +427 -0
gitflow_analytics/reports/example_usage.py +344 -0
gitflow_analytics/reports/factory.py +499 -0
gitflow_analytics/reports/formatters.py +698 -0
gitflow_analytics/reports/html_generator.py +1116 -0
gitflow_analytics/reports/interfaces.py +489 -0
gitflow_analytics/reports/json_exporter.py +2770 -0
gitflow_analytics/reports/narrative_writer.py +2287 -158
gitflow_analytics/reports/story_point_correlation.py +1144 -0
gitflow_analytics/reports/weekly_trends_writer.py +389 -0
gitflow_analytics/training/__init__.py +5 -0
gitflow_analytics/training/model_loader.py +377 -0
gitflow_analytics/training/pipeline.py +550 -0
gitflow_analytics/tui/__init__.py +1 -1
gitflow_analytics/tui/app.py +129 -126
gitflow_analytics/tui/screens/__init__.py +3 -3
gitflow_analytics/tui/screens/analysis_progress_screen.py +188 -179
gitflow_analytics/tui/screens/configuration_screen.py +154 -178
gitflow_analytics/tui/screens/loading_screen.py +100 -110
gitflow_analytics/tui/screens/main_screen.py +89 -72
gitflow_analytics/tui/screens/results_screen.py +305 -281
gitflow_analytics/tui/widgets/__init__.py +2 -2
gitflow_analytics/tui/widgets/data_table.py +67 -69
gitflow_analytics/tui/widgets/export_modal.py +76 -76
gitflow_analytics/tui/widgets/progress_widget.py +41 -46
gitflow_analytics-1.3.6.dist-info/METADATA +1015 -0
gitflow_analytics-1.3.6.dist-info/RECORD +122 -0
gitflow_analytics-1.0.3.dist-info/METADATA +0 -490
gitflow_analytics-1.0.3.dist-info/RECORD +0 -62
{gitflow_analytics-1.0.3.dist-info → gitflow_analytics-1.3.6.dist-info}/WHEEL +0 -0
{gitflow_analytics-1.0.3.dist-info → gitflow_analytics-1.3.6.dist-info}/entry_points.txt +0 -0
{gitflow_analytics-1.0.3.dist-info → gitflow_analytics-1.3.6.dist-info}/licenses/LICENSE +0 -0
{gitflow_analytics-1.0.3.dist-info → gitflow_analytics-1.3.6.dist-info}/top_level.txt +0 -0

gitflow_analytics/qualitative/utils/batch_processor.py CHANGED Viewed

@@ -1,25 +1,26 @@
 """Batch processing utilities for efficient commit analysis."""
 import logging
+import time
+from collections.abc import Iterator
 from concurrent.futures import ThreadPoolExecutor, as_completed
-from typing import Any, Callable, Dict, Iterator, List, Optional, TypeVar
 from threading import Lock
-import time
+from typing import Any, Callable, Optional, TypeVar
-T = TypeVar('T')
-R = TypeVar('R')
+T = TypeVar("T")
+R = TypeVar("R")
 class BatchProcessor:
     """Efficient batch processing for commit analysis.
     This class provides utilities for processing large numbers of commits
     in batches with parallel execution, progress tracking, and error handling.
     """
     def __init__(self, batch_size: int = 1000, max_workers: int = 4):
         """Initialize batch processor.
         Args:
             batch_size: Number of items to process per batch
             max_workers: Maximum number of worker threads
@@ -29,257 +30,269 @@ class BatchProcessor:
         self.logger = logging.getLogger(__name__)
         self._stats_lock = Lock()
         self._processing_stats = {
-            'total_processed': 0,
-            'total_errors': 0,
-            'batch_times': [],
-            'start_time': None
+            "total_processed": 0,
+            "total_errors": 0,
+            "batch_times": [],
+            "start_time": None,
         }
-    def create_batches(self, items: List[T], batch_size: Optional[int] = None) -> Iterator[List[T]]:
+    def create_batches(self, items: list[T], batch_size: Optional[int] = None) -> Iterator[list[T]]:
         """Split items into batches for processing.
         Args:
             items: List of items to batch
             batch_size: Override default batch size
         Yields:
             Batches of items
         """
         batch_size = batch_size or self.batch_size
         for i in range(0, len(items), batch_size):
-            yield items[i:i + batch_size]
-    def process_batches(self, items: List[T], processor_func: Callable[[List[T]], List[R]],
-                       parallel: bool = True) -> List[R]:
+            yield items[i : i + batch_size]
+    def process_batches(
+        self, items: list[T], processor_func: Callable[[list[T]], list[R]], parallel: bool = True
+    ) -> list[R]:
         """Process items in batches with optional parallelization.
         Args:
             items: Items to process
             processor_func: Function that processes a batch and returns results
             parallel: Whether to use parallel processing
         Returns:
             List of all processing results
         """
         if not items:
             return []
         self._reset_stats()
-        self._processing_stats['start_time'] = time.time()
+        self._processing_stats["start_time"] = time.time()
         batches = list(self.create_batches(items))
         self.logger.info(f"Processing {len(items)} items in {len(batches)} batches")
         all_results = []
         if parallel and len(batches) > 1:
             all_results = self._process_parallel(batches, processor_func)
         else:
             all_results = self._process_sequential(batches, processor_func)
         self._log_final_stats(len(items))
         return all_results
-    def process_with_callback(self, items: List[T], processor_func: Callable[[List[T]], List[R]],
-                            progress_callback: Optional[Callable[[int, int], None]] = None) -> List[R]:
+    def process_with_callback(
+        self,
+        items: list[T],
+        processor_func: Callable[[list[T]], list[R]],
+        progress_callback: Optional[Callable[[int, int], None]] = None,
+    ) -> list[R]:
         """Process batches with progress callback.
         Args:
             items: Items to process
             processor_func: Function that processes a batch
             progress_callback: Callback for progress updates (processed, total)
         Returns:
             List of all processing results
         """
         if not items:
             return []
         self._reset_stats()
         batches = list(self.create_batches(items))
         all_results = []
         processed_count = 0
         for i, batch in enumerate(batches):
             batch_start = time.time()
             try:
                 batch_results = processor_func(batch)
                 all_results.extend(batch_results)
                 processed_count += len(batch)
                 with self._stats_lock:
-                    self._processing_stats['total_processed'] += len(batch)
-                    self._processing_stats['batch_times'].append(time.time() - batch_start)
+                    self._processing_stats["total_processed"] += len(batch)
+                    self._processing_stats["batch_times"].append(time.time() - batch_start)
             except Exception as e:
                 self.logger.error(f"Error processing batch {i}: {e}")
                 with self._stats_lock:
-                    self._processing_stats['total_errors'] += len(batch)
+                    self._processing_stats["total_errors"] += len(batch)
             # Call progress callback if provided
             if progress_callback:
                 progress_callback(processed_count, len(items))
         return all_results
-    def _process_parallel(self, batches: List[List[T]],
-                         processor_func: Callable[[List[T]], List[R]]) -> List[R]:
+    def _process_parallel(
+        self, batches: list[list[T]], processor_func: Callable[[list[T]], list[R]]
+    ) -> list[R]:
         """Process batches in parallel using ThreadPoolExecutor.
         Args:
             batches: List of batches to process
             processor_func: Function to process each batch
         Returns:
             Combined results from all batches
         """
         all_results = []
         with ThreadPoolExecutor(max_workers=self.max_workers) as executor:
             # Submit all batches
             future_to_batch = {
                 executor.submit(self._process_batch_with_timing, batch, processor_func): i
                 for i, batch in enumerate(batches)
             }
             # Collect results as they complete
             for future in as_completed(future_to_batch):
                 batch_idx = future_to_batch[future]
                 try:
                     batch_results, batch_time = future.result()
                     all_results.extend(batch_results)
                     with self._stats_lock:
-                        self._processing_stats['total_processed'] += len(batches[batch_idx])
-                        self._processing_stats['batch_times'].append(batch_time)
+                        self._processing_stats["total_processed"] += len(batches[batch_idx])
+                        self._processing_stats["batch_times"].append(batch_time)
                 except Exception as e:
                     self.logger.error(f"Error processing batch {batch_idx}: {e}")
                     with self._stats_lock:
-                        self._processing_stats['total_errors'] += len(batches[batch_idx])
+                        self._processing_stats["total_errors"] += len(batches[batch_idx])
         return all_results
-    def _process_sequential(self, batches: List[List[T]],
-                           processor_func: Callable[[List[T]], List[R]]) -> List[R]:
+    def _process_sequential(
+        self, batches: list[list[T]], processor_func: Callable[[list[T]], list[R]]
+    ) -> list[R]:
         """Process batches sequentially.
         Args:
-            batches: List of batches to process
+            batches: List of batches to process
             processor_func: Function to process each batch
         Returns:
             Combined results from all batches
         """
         all_results = []
         for i, batch in enumerate(batches):
             try:
                 batch_results, batch_time = self._process_batch_with_timing(batch, processor_func)
                 all_results.extend(batch_results)
-                self._processing_stats['total_processed'] += len(batch)
-                self._processing_stats['batch_times'].append(batch_time)
+                self._processing_stats["total_processed"] += len(batch)
+                self._processing_stats["batch_times"].append(batch_time)
             except Exception as e:
                 self.logger.error(f"Error processing batch {i}: {e}")
-                self._processing_stats['total_errors'] += len(batch)
+                self._processing_stats["total_errors"] += len(batch)
         return all_results
-    def _process_batch_with_timing(self, batch: List[T],
-                                  processor_func: Callable[[List[T]], List[R]]) -> tuple[List[R], float]:
+    def _process_batch_with_timing(
+        self, batch: list[T], processor_func: Callable[[list[T]], list[R]]
+    ) -> tuple[list[R], float]:
         """Process a single batch with timing.
         Args:
             batch: Batch to process
             processor_func: Processing function
         Returns:
             Tuple of (results, processing_time_seconds)
         """
         start_time = time.time()
         results = processor_func(batch)
         processing_time = time.time() - start_time
         return results, processing_time
     def _reset_stats(self) -> None:
         """Reset processing statistics."""
         with self._stats_lock:
             self._processing_stats = {
-                'total_processed': 0,
-                'total_errors': 0,
-                'batch_times': [],
-                'start_time': time.time()
+                "total_processed": 0,
+                "total_errors": 0,
+                "batch_times": [],
+                "start_time": time.time(),
             }
     def _log_final_stats(self, total_items: int) -> None:
         """Log final processing statistics.
         Args:
             total_items: Total number of items processed
         """
         with self._stats_lock:
             stats = self._processing_stats.copy()
-        if not stats['batch_times']:
+        if not stats["batch_times"]:
             return
-        total_time = time.time() - stats['start_time']
-        avg_batch_time = sum(stats['batch_times']) / len(stats['batch_times'])
-        items_per_second = stats['total_processed'] / total_time if total_time > 0 else 0
+        total_time = time.time() - stats["start_time"]
+        avg_batch_time = sum(stats["batch_times"]) / len(stats["batch_times"])
+        items_per_second = stats["total_processed"] / total_time if total_time > 0 else 0
         self.logger.info(
             f"Batch processing complete: {stats['total_processed']}/{total_items} items processed "
             f"in {total_time:.2f}s ({items_per_second:.1f} items/s), "
             f"{stats['total_errors']} errors, avg batch time: {avg_batch_time:.2f}s"
         )
-    def get_processing_stats(self) -> Dict[str, Any]:
+    def get_processing_stats(self) -> dict[str, Any]:
         """Get current processing statistics.
         Returns:
             Dictionary with processing statistics
         """
         with self._stats_lock:
             stats = self._processing_stats.copy()
-        if stats['start_time'] and stats['batch_times']:
-            elapsed_time = time.time() - stats['start_time']
-            avg_batch_time = sum(stats['batch_times']) / len(stats['batch_times'])
-            items_per_second = stats['total_processed'] / elapsed_time if elapsed_time > 0 else 0
+        if stats["start_time"] and stats["batch_times"]:
+            elapsed_time = time.time() - stats["start_time"]
+            avg_batch_time = sum(stats["batch_times"]) / len(stats["batch_times"])
+            items_per_second = stats["total_processed"] / elapsed_time if elapsed_time > 0 else 0
             return {
-                'total_processed': stats['total_processed'],
-                'total_errors': stats['total_errors'],
-                'elapsed_time_seconds': elapsed_time,
-                'avg_batch_time_seconds': avg_batch_time,
-                'items_per_second': items_per_second,
-                'batches_completed': len(stats['batch_times']),
-                'error_rate': stats['total_errors'] / (stats['total_processed'] + stats['total_errors']) if (stats['total_processed'] + stats['total_errors']) > 0 else 0.0
+                "total_processed": stats["total_processed"],
+                "total_errors": stats["total_errors"],
+                "elapsed_time_seconds": elapsed_time,
+                "avg_batch_time_seconds": avg_batch_time,
+                "items_per_second": items_per_second,
+                "batches_completed": len(stats["batch_times"]),
+                "error_rate": (
+                    stats["total_errors"] / (stats["total_processed"] + stats["total_errors"])
+                    if (stats["total_processed"] + stats["total_errors"]) > 0
+                    else 0.0
+                ),
             }
         else:
             return {
-                'total_processed': 0,
-                'total_errors': 0,
-                'elapsed_time_seconds': 0,
-                'avg_batch_time_seconds': 0,
-                'items_per_second': 0,
-                'batches_completed': 0,
-                'error_rate': 0.0
+                "total_processed": 0,
+                "total_errors": 0,
+                "elapsed_time_seconds": 0,
+                "avg_batch_time_seconds": 0,
+                "items_per_second": 0,
+                "batches_completed": 0,
+                "error_rate": 0.0,
             }
 class ProgressTracker:
     """Simple progress tracking for long-running operations."""
     def __init__(self, total: int, description: str = "Processing"):
         """Initialize progress tracker.
         Args:
             total: Total number of items to process
             description: Description of the operation
@@ -290,28 +303,28 @@ class ProgressTracker:
         self.start_time = time.time()
         self.last_report = 0
         self.logger = logging.getLogger(__name__)
     def update(self, count: int = 1) -> None:
         """Update progress count.
         Args:
             count: Number of items processed since last update
         """
         self.processed += count
         # Report progress every 10% or every 1000 items, whichever is less frequent
         report_interval = max(self.total // 10, 1000)
         if self.processed - self.last_report >= report_interval or self.processed >= self.total:
             self._report_progress()
             self.last_report = self.processed
     def _report_progress(self) -> None:
         """Report current progress."""
         elapsed_time = time.time() - self.start_time
         percentage = (self.processed / self.total) * 100 if self.total > 0 else 0
         rate = self.processed / elapsed_time if elapsed_time > 0 else 0
         # Estimate time remaining
         if rate > 0 and self.processed < self.total:
             remaining_items = self.total - self.processed
@@ -319,8 +332,8 @@ class ProgressTracker:
             eta_str = f", ETA: {eta_seconds:.0f}s"
         else:
             eta_str = ""
         self.logger.info(
             f"{self.description}: {self.processed}/{self.total} ({percentage:.1f}%) "
             f"at {rate:.1f} items/s{eta_str}"
-        )
+        )

gitflow-analytics 1.0.3__py3-none-any.whl → 1.3.6__py3-none-any.whl

gitflow-analytics 1.0.3py3-none-any.whl → 1.3.6py3-none-any.whl