PyPI - greenmining - Versions diffs - 1.0.4__py3-none-any.whl → 1.0.6__py3-none-any.whl - Mend

greenmining 1.0.4py3-none-any.whl → 1.0.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

greenmining/__init__.py +46 -2
greenmining/__version__.py +1 -1
greenmining/analyzers/__init__.py +9 -0
greenmining/analyzers/metrics_power_correlator.py +165 -0
greenmining/analyzers/power_regression.py +212 -0
greenmining/analyzers/version_power_analyzer.py +246 -0
greenmining/config.py +46 -34
greenmining/dashboard/__init__.py +5 -0
greenmining/dashboard/app.py +200 -0
greenmining/energy/__init__.py +8 -1
greenmining/energy/base.py +45 -35
greenmining/energy/carbon_reporter.py +242 -0
greenmining/energy/codecarbon_meter.py +25 -24
greenmining/energy/cpu_meter.py +144 -0
greenmining/energy/rapl.py +30 -36
greenmining/services/__init__.py +13 -3
greenmining/services/commit_extractor.py +9 -5
greenmining/services/github_fetcher.py +16 -18
greenmining/services/github_graphql_fetcher.py +45 -55
greenmining/services/local_repo_analyzer.py +325 -63
greenmining/services/reports.py +5 -8
{greenmining-1.0.4.dist-info → greenmining-1.0.6.dist-info}/METADATA +65 -54
greenmining-1.0.6.dist-info/RECORD +44 -0
greenmining-1.0.4.dist-info/RECORD +0 -37
{greenmining-1.0.4.dist-info → greenmining-1.0.6.dist-info}/WHEEL +0 -0
{greenmining-1.0.4.dist-info → greenmining-1.0.6.dist-info}/licenses/LICENSE +0 -0
{greenmining-1.0.4.dist-info → greenmining-1.0.6.dist-info}/top_level.txt +0 -0

greenmining/energy/rapl.py CHANGED Viewed

@@ -13,9 +13,9 @@ from .base import EnergyMeter, EnergyMetrics, EnergyBackend
 class RAPLEnergyMeter(EnergyMeter):
     # Energy measurement using Intel RAPL on Linux.
     RAPL_PATH = Path("/sys/class/powercap/intel-rapl")
     def __init__(self):
         # Initialize RAPL energy meter.
         super().__init__(EnergyBackend.RAPL)
@@ -24,12 +24,12 @@ class RAPLEnergyMeter(EnergyMeter):
         self._start_time: Optional[float] = None
         self._power_samples: List[float] = []
         self._discover_domains()
     def _discover_domains(self) -> None:
         # Discover available RAPL domains.
         if not self.RAPL_PATH.exists():
             return
         # Find all RAPL domains (intel-rapl:0, intel-rapl:0:0, etc.)
         for domain_path in self.RAPL_PATH.glob("intel-rapl:*"):
             if (domain_path / "energy_uj").exists():
@@ -39,9 +39,9 @@ class RAPLEnergyMeter(EnergyMeter):
                     domain_name = name_file.read_text().strip()
                 else:
                     domain_name = domain_path.name
                 self._domains[domain_name] = domain_path / "energy_uj"
             # Check for sub-domains (core, uncore, dram, etc.)
             for subdomain_path in domain_path.glob("intel-rapl:*:*"):
                 if (subdomain_path / "energy_uj").exists():
@@ -50,24 +50,24 @@ class RAPLEnergyMeter(EnergyMeter):
                         subdomain_name = name_file.read_text().strip()
                     else:
                         subdomain_name = subdomain_path.name
                     self._domains[subdomain_name] = subdomain_path / "energy_uj"
     def _read_energy(self, path: Path) -> int:
         # Read energy value in microjoules from a RAPL file.
         try:
             return int(path.read_text().strip())
         except (PermissionError, FileNotFoundError, ValueError):
             return 0
     def is_available(self) -> bool:
         # Check if RAPL is available on this system.
         if not self.RAPL_PATH.exists():
             return False
         if not self._domains:
             return False
         # Try to read at least one domain
         for path in self._domains.values():
             try:
@@ -75,68 +75,62 @@ class RAPLEnergyMeter(EnergyMeter):
                 return True
             except Exception:
                 continue
         return False
     def start(self) -> None:
         # Start energy measurement.
         if self._is_measuring:
             raise RuntimeError("Already measuring energy")
         self._is_measuring = True
         self._start_time = time.time()
         self._power_samples = []
         # Read starting energy values for all domains
-        self._start_energy = {
-            name: self._read_energy(path)
-            for name, path in self._domains.items()
-        }
+        self._start_energy = {name: self._read_energy(path) for name, path in self._domains.items()}
     def stop(self) -> EnergyMetrics:
         # Stop energy measurement and return results.
         if not self._is_measuring:
             raise RuntimeError("Not currently measuring energy")
         end_time = time.time()
         self._is_measuring = False
         # Read ending energy values
-        end_energy = {
-            name: self._read_energy(path)
-            for name, path in self._domains.items()
-        }
+        end_energy = {name: self._read_energy(path) for name, path in self._domains.items()}
         # Calculate energy consumption per domain (in joules)
         duration = end_time - self._start_time
         # Handle counter wrap-around (RAPL counters are typically 32-bit)
         MAX_ENERGY_UJ = 2**32
         domain_energy = {}
         for name in self._domains:
             start = self._start_energy.get(name, 0)
             end = end_energy.get(name, 0)
             if end >= start:
                 delta_uj = end - start
             else:
                 # Counter wrapped around
                 delta_uj = (MAX_ENERGY_UJ - start) + end
             domain_energy[name] = delta_uj / 1_000_000  # Convert to joules
         # Aggregate metrics
         total_joules = sum(domain_energy.values())
         # Extract component-specific energy
         cpu_energy = domain_energy.get("core", 0) or domain_energy.get("package-0", total_joules)
         dram_energy = domain_energy.get("dram", 0)
         gpu_energy = domain_energy.get("uncore", None)  # Integrated GPU
         # Calculate power
         watts_avg = total_joules / duration if duration > 0 else 0
         return EnergyMetrics(
             joules=total_joules,
             watts_avg=watts_avg,
@@ -151,7 +145,7 @@ class RAPLEnergyMeter(EnergyMeter):
             start_time=datetime.fromtimestamp(self._start_time),
             end_time=datetime.fromtimestamp(end_time),
         )
     def get_available_domains(self) -> List[str]:
         # Get list of available RAPL domains.
         return list(self._domains.keys())

greenmining/services/__init__.py CHANGED Viewed

@@ -3,15 +3,25 @@
 from .commit_extractor import CommitExtractor
 from .data_aggregator import DataAggregator
 from .data_analyzer import DataAnalyzer
-from .github_fetcher import GitHubFetcher
-from .local_repo_analyzer import LocalRepoAnalyzer
+from .github_graphql_fetcher import GitHubGraphQLFetcher
+from .local_repo_analyzer import (
+    LocalRepoAnalyzer,
+    CommitAnalysis,
+    RepositoryAnalysis,
+    MethodMetrics,
+    SourceCodeChange,
+)
 from .reports import ReportGenerator
 __all__ = [
-    "GitHubFetcher",
+    "GitHubGraphQLFetcher",
     "CommitExtractor",
     "DataAnalyzer",
     "DataAggregator",
     "ReportGenerator",
     "LocalRepoAnalyzer",
+    "CommitAnalysis",
+    "RepositoryAnalysis",
+    "MethodMetrics",
+    "SourceCodeChange",
 ]

greenmining/services/commit_extractor.py CHANGED Viewed

@@ -41,7 +41,9 @@ class CommitExtractor:
         self.github = Github(github_token) if github_token else None
         self.timeout = timeout
-    def extract_from_repositories(self, repositories: list[dict[str, Any] | Repository]) -> list[dict[str, Any]]:
+    def extract_from_repositories(
+        self, repositories: list[dict[str, Any] | Repository]
+    ) -> list[dict[str, Any]]:
         # Extract commits from list of repositories.
         all_commits = []
         failed_repos = []
@@ -74,15 +76,17 @@ class CommitExtractor:
                     pbar.update(1)
                 except TimeoutError:
                     signal.alarm(0)  # Cancel alarm
-                    repo_name = repo.full_name if isinstance(repo, Repository) else repo["full_name"]
-                    colored_print(
-                        f"\nTimeout processing {repo_name} (>{self.timeout}s)", "yellow"
+                    repo_name = (
+                        repo.full_name if isinstance(repo, Repository) else repo["full_name"]
                     )
+                    colored_print(f"\nTimeout processing {repo_name} (>{self.timeout}s)", "yellow")
                     failed_repos.append(repo_name)
                     pbar.update(1)
                 except Exception as e:
                     signal.alarm(0)  # Cancel alarm
-                    repo_name = repo.full_name if isinstance(repo, Repository) else repo["full_name"]
+                    repo_name = (
+                        repo.full_name if isinstance(repo, Repository) else repo["full_name"]
+                    )
                     colored_print(f"\nError processing {repo_name}: {e}", "yellow")
                     failed_repos.append(repo_name)
                     pbar.update(1)

greenmining/services/github_fetcher.py CHANGED Viewed

@@ -1,21 +1,19 @@
-"""
-================================================================================
-DEADCODE - OLD REST API IMPLEMENTATION
-================================================================================
-This file contains the OLD GitHub REST API implementation.
-It has been REPLACED by GitHubGraphQLFetcher for better performance.
-Performance comparison:
-  REST API:    10+ requests for 100 repos, ~2 minutes
-  GraphQL API: 1-2 requests for 100 repos, ~15 seconds (10x faster!)
-USE INSTEAD: greenmining.services.github_graphql_fetcher.GitHubGraphQLFetcher
-This file is kept for reference only. Do not use in production.
-================================================================================
-"""
+# ================================================================================
+# DEADCODE - OLD REST API IMPLEMENTATION
+# ================================================================================
+#
+# This file contains the OLD GitHub REST API implementation.
+# It has been REPLACED by GitHubGraphQLFetcher for better performance.
+#
+# Performance comparison:
+#   REST API:    10+ requests for 100 repos, ~2 minutes
+#   GraphQL API: 1-2 requests for 100 repos, ~15 seconds (10x faster!)
+#
+# USE INSTEAD: greenmining.services.github_graphql_fetcher.GitHubGraphQLFetcher
+#
+# This file is kept for reference only. Do not use in production.
+#
+# ================================================================================
 # GitHub repository fetcher for green microservices mining.

greenmining/services/github_graphql_fetcher.py CHANGED Viewed

@@ -1,9 +1,7 @@
-"""
-GitHub GraphQL API fetcher for faster and more efficient repository fetching.
-GraphQL allows fetching exactly the data you need in a single request,
-reducing API calls and improving rate limit efficiency.
-"""
+# GitHub GraphQL API fetcher for faster and more efficient repository fetching.
+#
+# GraphQL allows fetching exactly the data you need in a single request,
+# reducing API calls and improving rate limit efficiency.
 import json
 import time
@@ -15,25 +13,21 @@ from greenmining.models.repository import Repository
 class GitHubGraphQLFetcher:
-    """
-    Fetch GitHub repositories using GraphQL API v4.
-    Benefits over REST API:
-    - Fetch repos + commits in 1 request instead of 100+ REST calls
-    - Get exactly the fields you need (no over-fetching)
-    - Better rate limit efficiency (5000 points/hour vs 5000 requests/hour)
-    - More powerful search capabilities
-    """
+    # Fetch GitHub repositories using GraphQL API v4.
+    #
+    # Benefits over REST API:
+    # - Fetch repos + commits in 1 request instead of 100+ REST calls
+    # - Get exactly the fields you need (no over-fetching)
+    # - Better rate limit efficiency (5000 points/hour vs 5000 requests/hour)
+    # - More powerful search capabilities
     GRAPHQL_ENDPOINT = "https://api.github.com/graphql"
     def __init__(self, token: str):
-        """
-        Initialize GraphQL fetcher.
-        Args:
-            token: GitHub personal access token
-        """
+        # Initialize GraphQL fetcher.
+        #
+        # Args:
+        #     token: GitHub personal access token
         self.token = token
         self.headers = {
             "Authorization": f"Bearer {token}",
@@ -51,22 +45,20 @@ class GitHubGraphQLFetcher:
         pushed_after: Optional[str] = None,
         pushed_before: Optional[str] = None,
     ) -> List[Repository]:
-        """
-        Search GitHub repositories using GraphQL.
-        Args:
-            keywords: Search keywords
-            max_repos: Maximum number of repositories to fetch
-            min_stars: Minimum star count
-            languages: Programming languages to filter
-            created_after: Created after date (YYYY-MM-DD)
-            created_before: Created before date (YYYY-MM-DD)
-            pushed_after: Pushed after date (YYYY-MM-DD)
-            pushed_before: Pushed before date (YYYY-MM-DD)
-        Returns:
-            List of Repository objects
-        """
+        # Search GitHub repositories using GraphQL.
+        #
+        # Args:
+        #     keywords: Search keywords
+        #     max_repos: Maximum number of repositories to fetch
+        #     min_stars: Minimum star count
+        #     languages: Programming languages to filter
+        #     created_after: Created after date (YYYY-MM-DD)
+        #     created_before: Created before date (YYYY-MM-DD)
+        #     pushed_after: Pushed after date (YYYY-MM-DD)
+        #     pushed_before: Pushed before date (YYYY-MM-DD)
+        #
+        # Returns:
+        #     List of Repository objects
         # Build search query
         search_query = self._build_search_query(
             keywords,
@@ -195,7 +187,7 @@ class GitHubGraphQLFetcher:
         pushed_after: Optional[str],
         pushed_before: Optional[str],
     ) -> str:
-        """Build GitHub search query string."""
+        # Build GitHub search query string.
         query_parts = [keywords]
         # Star count
@@ -219,7 +211,7 @@ class GitHubGraphQLFetcher:
         return " ".join(query_parts)
     def _execute_query(self, query: str, variables: Dict[str, Any]) -> Dict[str, Any]:
-        """Execute GraphQL query."""
+        # Execute GraphQL query.
         payload = {"query": query, "variables": variables}
         response = requests.post(
@@ -230,7 +222,7 @@ class GitHubGraphQLFetcher:
         return response.json()
     def _parse_repository(self, node: Dict[str, Any]) -> Repository:
-        """Parse GraphQL repository node to Repository object."""
+        # Parse GraphQL repository node to Repository object.
         # Extract languages
         languages = []
         if node.get("languages") and node["languages"].get("nodes"):
@@ -265,20 +257,18 @@ class GitHubGraphQLFetcher:
     def get_repository_commits(
         self, owner: str, name: str, max_commits: int = 100
     ) -> List[Dict[str, Any]]:
-        """
-        Fetch commits for a specific repository using GraphQL.
-        This is much faster than REST API as it gets all commits in 1-2 requests
-        instead of paginating through 100 individual REST calls.
-        Args:
-            owner: Repository owner
-            name: Repository name
-            max_commits: Maximum commits to fetch
-        Returns:
-            List of commit dictionaries
-        """
+        # Fetch commits for a specific repository using GraphQL.
+        #
+        # This is much faster than REST API as it gets all commits in 1-2 requests
+        # instead of paginating through 100 individual REST calls.
+        #
+        # Args:
+        #     owner: Repository owner
+        #     name: Repository name
+        #     max_commits: Maximum commits to fetch
+        #
+        # Returns:
+        #     List of commit dictionaries
         query = """
         query($owner: String!, $name: String!, $first: Int!) {
           repository(owner: $owner, name: $name) {
@@ -359,7 +349,7 @@ class GitHubGraphQLFetcher:
         return commits
     def save_results(self, repositories: List[Repository], output_file: str):
-        """Save repositories to JSON file."""
+        # Save repositories to JSON file.
         data = {
             "total_repositories": len(repositories),
             "repositories": [repo.to_dict() for repo in repositories],

greenmining 1.0.4__py3-none-any.whl → 1.0.6__py3-none-any.whl

greenmining 1.0.4py3-none-any.whl → 1.0.6py3-none-any.whl