PyPI - ossa-scanner - Versions diffs - 0.1.2__tar.gz → 0.1.3__tar.gz - Mend

ossa-scanner 0.1.2tar.gz → 0.1.3tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (24) hide show

{ossa_scanner-0.1.2 → ossa_scanner-0.1.3}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: ossa_scanner
-Version: 0.1.2
+Version: 0.1.3
 Summary: A Python library for scanning Linux packages, managing metadata, and generating SWHIDs.
 Home-page: https://github.com/oscarvalenzuelab/ossa_scanner
 Author: Oscar Valenzuela

ossa_scanner-0.1.3/ossa_scanner/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ __version__ = "0.1.3"

ossa_scanner-0.1.3/ossa_scanner/cli.py ADDED Viewed

@@ -0,0 +1,50 @@
+import argparse
+import os
+import shutil
+from .scanner import Scanner
+from .uploader import GitHubUploader
+def main():
+    parser = argparse.ArgumentParser(description="OSSA Scanner CLI Tool")
+    parser.add_argument('--threads', type=int, default=4, help="Number of threads for parallel processing")
+    parser.add_argument('--upload', action='store_true', help="Upload results to GitHub")
+    parser.add_argument('--repo-owner', type=str, help="GitHub repository owner (required for upload)")
+    parser.add_argument('--repo-name', type=str, help="GitHub repository name (required for upload)")
+    parser.add_argument('--token', type=str, help="GitHub token (required for upload)")
+    parser.add_argument('--repo-dir', type=str, help="Target directory in GitHub repo for results (required for upload)")
+    parser.add_argument('--retain-temp', action='store_true', help="Retain the temporary directory for downloaded and extracted packages")
+    args = parser.parse_args()
+    # Define directories
+    reports_dir = os.path.join(os.getcwd(), "ossa_reports")
+    temp_dir = "/tmp/ossa_temp"
+    os.makedirs(reports_dir, exist_ok=True)
+    os.makedirs(temp_dir, exist_ok=True)
+    try:
+        # Initialize the scanner
+        scanner = Scanner(threads=args.threads, output_dir=reports_dir, temp_dir=temp_dir)
+        # Perform scanning
+        results = scanner.scan_packages()
+        # Handle GitHub upload if specified
+        if args.upload:
+            if not (args.repo_owner and args.repo_name and args.token and args.repo_dir):
+                raise ValueError("GitHub upload requires --repo-owner, --repo-name, --token, and --repo-dir")
+            uploader = GitHubUploader(args.token, args.repo_owner, args.repo_name)
+            for report_file in os.listdir(reports_dir):
+                report_path = os.path.join(reports_dir, report_file)
+                if os.path.isfile(report_path):
+                    uploader.upload_file(report_path, os.path.join(args.repo_dir, report_file), "Add OSSA report")
+    finally:
+        # Clean up the temporary directory unless the user opts to retain it
+        if not args.retain_temp:
+            print(f"Cleaning up temporary directory: {temp_dir}")
+            shutil.rmtree(temp_dir, ignore_errors=True)
+if __name__ == "__main__":
+    main()

ossa_scanner-0.1.3/ossa_scanner/scanner.py ADDED Viewed

@@ -0,0 +1,123 @@
+import os
+import json
+import hashlib
+from datetime import datetime
+from concurrent.futures import ThreadPoolExecutor, as_completed
+from .utils.os_detection import detect_os
+from .utils.package_manager import list_packages, get_package_info
+from .utils.downloader import download_source
+from .utils.hash_calculator import calculate_file_hash
+from .utils.swhid_calculator import calculate_swhid
+class Scanner:
+    def __init__(self, threads=4, output_dir="ossa_reports", temp_dir="/tmp/ossa_temp"):
+        self.output_dir = output_dir
+        self.temp_dir = temp_dir
+        self.os_type = detect_os()
+        self.threads = threads
+        os.makedirs(self.temp_dir, exist_ok=True)
+    def process_package(self, package):
+        """
+        Processes a single package: downloads source, extracts, calculates hash and SWHID.
+        Args:
+            package (str): Package name to process.
+        Returns:
+            dict: Result of the processed package including hash and SWHID.
+        """
+        try:
+            print(f"Processing package: {package}")
+            package_info = get_package_info(self.os_type, package)
+            print(f"Fetched metadata for {package}")
+            # Download the source code to temp_dir
+            source_file = download_source(self.os_type, package, self.temp_dir)
+            print(f"Downloaded source file: {source_file}")
+            # Calculate hash of the source file
+            file_hash = calculate_file_hash(source_file)
+            print(f"Hash (SHA256) for {package}: {file_hash}")
+            # Extract source code directory in temp_dir
+            source_dir = os.path.join(self.temp_dir, package)
+            os.makedirs(source_dir, exist_ok=True)
+            # Calculate SWHID
+            swhid = calculate_swhid(source_dir)
+            print(f"SWHID for {package}: {swhid}")
+            # Save report
+            self.save_package_report(package, package_info, file_hash, swhid, source_file)
+        except Exception as e:
+            print(f"Error processing package {package}: {e}")
+    def scan_packages(self):
+        """
+        Scans all packages in the repository and processes them in parallel.
+        """
+        print(f"Detected OS: {self.os_type}")
+        print("Listing available packages...")
+        packages = list_packages(self.os_type)
+        with ThreadPoolExecutor(max_workers=self.threads) as executor:
+            # Submit tasks for parallel processing
+            future_to_package = {
+                executor.submit(self.process_package, package): package
+                for package in packages
+            }
+            for future in as_completed(future_to_package):
+                package = future_to_package[future]
+                try:
+                    future.result()
+                except Exception as e:
+                    print(f"Exception occurred for package {package}: {e}")
+    def save_package_report(self, package, package_info, file_hash, swhid, source_file):
+        """
+        Save the report for a single package.
+        Args:
+            package (str): Package name.
+            package_info (dict): Information about the package.
+            file_hash (str): SHA256 hash of the downloaded source.
+            swhid (str): Software Heritage ID of the package.
+        """
+        # Generate report filename
+        sha1_name = hashlib.sha1(package.encode()).hexdigest()
+        date_str = datetime.now().strftime("%Y%m%d")
+        report_filename = f"ossa-{date_str}-{sha1_name}-{package}.json"
+        report_path = os.path.join(self.output_dir, report_filename)
+        # Create the report content
+        report = {
+            "id": f"OSSA-{date_str}-{sha1_name.upper()}",
+            "version": "1.0.0",
+            "severity": "Informational",
+            "title": f"Advisory for {package}",
+            "package_name": package,
+            "publisher": "Generated by OSSA Collector",
+            "last_updated": datetime.now().isoformat(),
+            "approvals": [{"consumption": True, "externalization": True}],
+            "description": f"Automatically generated OSSA for the package {package}.",
+            "purls": [f"pkg:{self.os_type}/{package}"],
+            "regex": [f"^pkg:{self.os_type}/{package}.*"],
+            "affected_versions": ["*.*"],
+            "artifacts": [
+                {
+                    "url": f"file://{source_file}",
+                    "hashes": {"sha256": file_hash},
+                    "swhid": swhid
+                }
+            ],
+            "licenses": package_info.get("licenses", []),
+            "aliases": package_info.get("aliases", []),
+            "references": package_info.get("references", [])
+        }
+        # Save the report to the output directory
+        with open(report_path, "w") as f:
+            json.dump(report, f, indent=4)
+        print(f"Report saved: {report_path}")

{ossa_scanner-0.1.2 → ossa_scanner-0.1.3}/ossa_scanner.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: ossa_scanner
-Version: 0.1.2
+Version: 0.1.3
 Summary: A Python library for scanning Linux packages, managing metadata, and generating SWHIDs.
 Home-page: https://github.com/oscarvalenzuelab/ossa_scanner
 Author: Oscar Valenzuela

ossa_scanner-0.1.2/ossa_scanner/__init__.py DELETED Viewed

	@@ -1 +0,0 @@
1	- __version__ = "0.1.2"

ossa_scanner-0.1.2/ossa_scanner/cli.py DELETED Viewed

@@ -1,35 +0,0 @@
-import argparse
-from .scanner import Scanner
-from .uploader import GitHubUploader
-def main():
-    parser = argparse.ArgumentParser(description="OSSA Scanner CLI Tool")
-    parser.add_argument('--output-dir', type=str, required=True, help="Directory to save downloaded source")
-    parser.add_argument('--results-file', type=str, required=True, help="Path to save the JSON results")
-    parser.add_argument('--threads', type=int, default=4, help="Number of threads for parallel processing")
-    parser.add_argument('--upload', action='store_true', help="Upload results to GitHub")
-    parser.add_argument('--repo-owner', type=str, help="GitHub repository owner")
-    parser.add_argument('--repo-name', type=str, help="GitHub repository name")
-    parser.add_argument('--token', type=str, help="GitHub token")
-    parser.add_argument('--repo-dir', type=str, help="Target directory in GitHub repo for results")
-    args = parser.parse_args()
-    # Initialize the scanner
-    scanner = Scanner(output_dir=args.output_dir, threads=args.threads)
-    # Perform scanning
-    results = scanner.scan_packages()
-    # Save results locally
-    scanner.save_results(results, args.results_file)
-    # Upload results to GitHub if specified
-    if args.upload:
-        if not (args.repo_owner and args.repo_name and args.token and args.repo_dir):
-            raise ValueError("GitHub upload requires --repo-owner, --repo-name, --token, and --repo-dir")
-        uploader = GitHubUploader(args.token, args.repo_owner, args.repo_name)
-        scanner.upload_results(args.results_file, uploader, args.repo_dir)
-if __name__ == "__main__":
-    main()

ossa_scanner-0.1.2/ossa_scanner/scanner.py DELETED Viewed

@@ -1,113 +0,0 @@
-import os
-import json
-from concurrent.futures import ThreadPoolExecutor, as_completed
-from .utils.os_detection import detect_os
-from .utils.package_manager import list_packages, get_package_info
-from .utils.downloader import download_source
-from .utils.hash_calculator import calculate_file_hash
-from .utils.swhid_calculator import calculate_swhid
-from .uploader import GitHubUploader
-class Scanner:
-    def __init__(self, output_dir, threads=4):
-        self.output_dir = output_dir
-        self.os_type = detect_os()
-        self.threads = threads
-    def process_package(self, package):
-        """
-        Processes a single package: downloads source, extracts, calculates hash and SWHID.
-        Args:
-            package (str): Package name to process.
-        Returns:
-            dict: Result of the processed package including hash and SWHID.
-        """
-        try:
-            print(f"Processing package: {package}")
-            package_info = get_package_info(self.os_type, package)
-            print(f"Fetched metadata for {package}")
-            # Download the source code
-            source_file = download_source(self.os_type, package, self.output_dir)
-            print(f"Downloaded source file: {source_file}")
-            # Calculate hash of the source file
-            file_hash = calculate_file_hash(source_file)
-            print(f"Hash (SHA256) for {package}: {file_hash}")
-            # Extract source code directory
-            source_dir = os.path.join(self.output_dir, package)
-            os.makedirs(source_dir, exist_ok=True)
-            # Calculate SWHID
-            swhid = calculate_swhid(source_dir)
-            print(f"SWHID for {package}: {swhid}")
-            return {
-                "package": package,
-                "info": package_info,
-                "hash": file_hash,
-                "swhid": swhid,
-            }
-        except Exception as e:
-            print(f"Error processing package {package}: {e}")
-            return {
-                "package": package,
-                "error": str(e)
-            }
-    def scan_packages(self):
-        """
-        Scans all packages in the repository and processes them in parallel.
-        Returns:
-            list: List of results for each package.
-        """
-        print(f"Detected OS: {self.os_type}")
-        print("Listing available packages...")
-        packages = list_packages(self.os_type)
-        results = []
-        with ThreadPoolExecutor(max_workers=self.threads) as executor:
-            # Submit tasks for parallel processing
-            future_to_package = {
-                executor.submit(self.process_package, package): package
-                for package in packages
-            }
-            for future in as_completed(future_to_package):
-                package = future_to_package[future]
-                try:
-                    result = future.result()
-                    results.append(result)
-                except Exception as e:
-                    print(f"Exception occurred for package {package}: {e}")
-        return results
-    def save_results(self, results, output_file):
-        """
-        Save the scan results to a JSON file.
-        Args:
-            results (list): List of results for each package.
-            output_file (str): Path to save the JSON file.
-        """
-        with open(output_file, "w") as f:
-            json.dump(results, f, indent=4)
-        print(f"Results saved to {output_file}")
-    def upload_results(self, results_file, github_uploader, repo_dir):
-        """
-        Uploads the results file to GitHub.
-        Args:
-            results_file (str): Local results file path to upload.
-            github_uploader (GitHubUploader): Instance of the GitHubUploader class.
-            repo_dir (str): Path in the GitHub repository where the results will be uploaded.
-        """
-        print(f"Uploading results to GitHub: {repo_dir}")
-        repo_path = os.path.join(repo_dir, os.path.basename(results_file))
-        github_uploader.upload_file(results_file, repo_path, "Add scanning results")