PyPI - angr - Versions diffs - 9.2.134__py3-none-manylinux2014_aarch64.whl → 9.2.136__py3-none-manylinux2014_aarch64.whl - Mend

angr 9.2.134__py3-none-manylinux2014_aarch64.whl → 9.2.136__py3-none-manylinux2014_aarch64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of angr might be problematic. Click here for more details.

Files changed (173) hide show

angr/__init__.py +1 -1
angr/analyses/__init__.py +5 -8
angr/analyses/analysis.py +4 -0
angr/analyses/backward_slice.py +1 -2
angr/analyses/binary_optimizer.py +3 -4
angr/analyses/bindiff.py +4 -6
angr/analyses/boyscout.py +1 -3
angr/analyses/callee_cleanup_finder.py +4 -4
angr/analyses/calling_convention/__init__.py +6 -0
angr/analyses/{calling_convention.py → calling_convention/calling_convention.py} +32 -64
angr/analyses/calling_convention/fact_collector.py +502 -0
angr/analyses/calling_convention/utils.py +57 -0
angr/analyses/cdg.py +1 -2
angr/analyses/cfg/cfb.py +1 -3
angr/analyses/cfg/cfg.py +2 -2
angr/analyses/cfg/cfg_base.py +37 -35
angr/analyses/cfg/cfg_emulated.py +1 -1
angr/analyses/cfg/cfg_fast.py +62 -15
angr/analyses/cfg/cfg_fast_soot.py +1 -1
angr/analyses/cfg/indirect_jump_resolvers/__init__.py +2 -0
angr/analyses/cfg/indirect_jump_resolvers/const_resolver.py +46 -10
angr/analyses/cfg/indirect_jump_resolvers/default_resolvers.py +5 -1
angr/analyses/cfg/indirect_jump_resolvers/jumptable.py +50 -14
angr/analyses/cfg/indirect_jump_resolvers/memload_resolver.py +81 -0
angr/analyses/cfg/indirect_jump_resolvers/propagator_utils.py +24 -5
angr/analyses/cfg/indirect_jump_resolvers/x86_pe_iat.py +2 -5
angr/analyses/complete_calling_conventions.py +32 -3
angr/analyses/congruency_check.py +2 -3
angr/analyses/data_dep/data_dependency_analysis.py +2 -2
angr/analyses/ddg.py +1 -4
angr/analyses/decompiler/ail_simplifier.py +3 -4
angr/analyses/decompiler/clinic.py +42 -7
angr/analyses/decompiler/optimization_passes/duplication_reverter/ail_merge_graph.py +2 -2
angr/analyses/decompiler/optimization_passes/duplication_reverter/duplication_reverter.py +2 -2
angr/analyses/decompiler/optimization_passes/ite_region_converter.py +1 -1
angr/analyses/decompiler/optimization_passes/lowered_switch_simplifier.py +1 -1
angr/analyses/decompiler/optimization_passes/register_save_area_simplifier.py +0 -6
angr/analyses/decompiler/optimization_passes/stack_canary_simplifier.py +2 -7
angr/analyses/decompiler/optimization_passes/switch_default_case_duplicator.py +0 -6
angr/analyses/decompiler/optimization_passes/win_stack_canary_simplifier.py +0 -6
angr/analyses/decompiler/structuring/phoenix.py +1 -1
angr/analyses/disassembly.py +5 -5
angr/analyses/fcp/__init__.py +4 -0
angr/analyses/fcp/fcp.py +429 -0
angr/analyses/identifier/identify.py +1 -3
angr/analyses/loopfinder.py +4 -3
angr/analyses/patchfinder.py +1 -1
angr/analyses/propagator/engine_base.py +4 -3
angr/analyses/propagator/propagator.py +14 -53
angr/analyses/reassembler.py +1 -2
angr/analyses/s_propagator.py +1 -3
angr/analyses/soot_class_hierarchy.py +1 -2
angr/analyses/stack_pointer_tracker.py +18 -2
angr/analyses/static_hooker.py +1 -2
angr/analyses/typehoon/simple_solver.py +2 -2
angr/analyses/variable_recovery/engine_vex.py +5 -0
angr/analyses/variable_recovery/variable_recovery_fast.py +1 -2
angr/analyses/veritesting.py +4 -7
angr/analyses/vfg.py +1 -1
angr/analyses/vsa_ddg.py +1 -2
angr/block.py +3 -2
angr/callable.py +1 -3
angr/calling_conventions.py +15 -7
angr/codenode.py +5 -1
angr/concretization_strategies/__init__.py +1 -83
angr/concretization_strategies/any.py +2 -1
angr/concretization_strategies/any_named.py +1 -1
angr/concretization_strategies/base.py +81 -0
angr/concretization_strategies/controlled_data.py +2 -1
angr/concretization_strategies/eval.py +2 -1
angr/concretization_strategies/logging.py +3 -1
angr/concretization_strategies/max.py +2 -1
angr/concretization_strategies/nonzero.py +2 -1
angr/concretization_strategies/nonzero_range.py +2 -1
angr/concretization_strategies/norepeats.py +2 -1
angr/concretization_strategies/norepeats_range.py +2 -1
angr/concretization_strategies/range.py +2 -1
angr/concretization_strategies/signed_add.py +2 -1
angr/concretization_strategies/single.py +2 -1
angr/concretization_strategies/solutions.py +2 -1
angr/concretization_strategies/unlimited_range.py +2 -1
angr/engines/__init__.py +8 -5
angr/engines/engine.py +3 -5
angr/engines/failure.py +4 -5
angr/engines/procedure.py +5 -7
angr/engines/soot/expressions/__init__.py +22 -23
angr/engines/soot/expressions/base.py +4 -4
angr/engines/soot/expressions/invoke.py +1 -2
angr/engines/soot/statements/__init__.py +9 -10
angr/engines/soot/values/__init__.py +9 -10
angr/engines/soot/values/arrayref.py +3 -3
angr/engines/soot/values/instancefieldref.py +3 -2
angr/engines/successors.py +7 -6
angr/engines/syscall.py +4 -6
angr/engines/unicorn.py +3 -2
angr/engines/vex/claripy/ccall.py +8 -10
angr/engines/vex/claripy/datalayer.py +4 -5
angr/exploration_techniques/__init__.py +0 -2
angr/exploration_techniques/spiller.py +1 -3
angr/exploration_techniques/stochastic.py +2 -3
angr/factory.py +3 -9
angr/knowledge_plugins/cfg/cfg_model.py +20 -17
angr/knowledge_plugins/functions/function.py +74 -77
angr/knowledge_plugins/functions/function_manager.py +14 -7
angr/knowledge_plugins/functions/function_parser.py +1 -1
angr/knowledge_plugins/functions/soot_function.py +16 -16
angr/knowledge_plugins/propagations/propagation_model.py +4 -5
angr/knowledge_plugins/propagations/states.py +0 -511
angr/procedures/libc/memcpy.py +4 -4
angr/procedures/procedure_dict.py +3 -2
angr/protos/__init__.py +2 -5
angr/protos/cfg_pb2.py +21 -18
angr/protos/function_pb2.py +17 -14
angr/protos/primitives_pb2.py +44 -39
angr/protos/variables_pb2.py +36 -31
angr/protos/xrefs_pb2.py +15 -12
angr/sim_procedure.py +15 -16
angr/sim_variable.py +13 -1
angr/simos/__init__.py +2 -0
angr/simos/javavm.py +4 -6
angr/simos/xbox.py +32 -0
angr/state_plugins/__init__.py +0 -2
angr/state_plugins/callstack.py +4 -4
angr/state_plugins/cgc.py +3 -2
angr/state_plugins/gdb.py +6 -5
angr/state_plugins/globals.py +1 -2
angr/state_plugins/heap/heap_brk.py +1 -2
angr/state_plugins/history.py +10 -12
angr/state_plugins/inspect.py +3 -5
angr/state_plugins/libc.py +2 -2
angr/state_plugins/log.py +8 -10
angr/state_plugins/loop_data.py +1 -2
angr/state_plugins/posix.py +7 -7
angr/state_plugins/preconstrainer.py +2 -3
angr/state_plugins/scratch.py +5 -8
angr/state_plugins/sim_action.py +3 -3
angr/state_plugins/solver.py +8 -3
angr/state_plugins/symbolizer.py +5 -4
angr/state_plugins/uc_manager.py +3 -3
angr/state_plugins/unicorn_engine.py +5 -1
angr/state_plugins/view.py +3 -5
angr/storage/file.py +3 -5
angr/storage/memory_mixins/address_concretization_mixin.py +2 -2
angr/storage/memory_mixins/bvv_conversion_mixin.py +3 -3
angr/storage/memory_mixins/clouseau_mixin.py +1 -3
angr/storage/memory_mixins/name_resolution_mixin.py +1 -3
angr/storage/memory_mixins/paged_memory/paged_memory_mixin.py +13 -15
angr/storage/memory_mixins/paged_memory/pages/__init__.py +1 -22
angr/storage/memory_mixins/paged_memory/pages/base.py +31 -0
angr/storage/memory_mixins/paged_memory/pages/list_page.py +1 -1
angr/storage/memory_mixins/paged_memory/pages/mv_list_page.py +1 -1
angr/storage/memory_mixins/paged_memory/pages/ultra_page.py +2 -4
angr/storage/memory_mixins/paged_memory/privileged_mixin.py +3 -4
angr/storage/memory_mixins/regioned_memory/abstract_merger_mixin.py +4 -2
angr/storage/memory_mixins/smart_find_mixin.py +1 -1
angr/storage/memory_mixins/underconstrained_mixin.py +1 -1
angr/storage/memory_mixins/unwrapper_mixin.py +1 -3
angr/utils/bits.py +13 -0
angr/utils/enums_conv.py +28 -12
angr/utils/segment_list.py +25 -22
angr/utils/timing.py +18 -1
angr/vaults.py +5 -6
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/METADATA +6 -6
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/RECORD +168 -164
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/WHEEL +1 -1
angr/analyses/propagator/outdated_definition_walker.py +0 -159
angr/analyses/propagator/tmpvar_finder.py +0 -18
angr/engines/concrete.py +0 -180
angr/exploration_techniques/symbion.py +0 -80
angr/state_plugins/concrete.py +0 -295
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/LICENSE +0 -0
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/entry_points.txt +0 -0
{angr-9.2.134.dist-info → angr-9.2.136.dist-info}/top_level.txt +0 -0

angr/analyses/calling_convention/fact_collector.py ADDED Viewed

@@ -0,0 +1,502 @@
+from __future__ import annotations
+from typing import Any
+import pyvex
+import claripy
+from angr.utils.bits import s2u, u2s
+from angr.block import Block
+from angr.analyses.analysis import Analysis
+from angr.analyses import AnalysesHub
+from angr.knowledge_plugins.functions import Function
+from angr.codenode import BlockNode, HookNode
+from angr.engines.light import SimEngineNostmtVEX, SimEngineLight, SpOffset, RegisterOffset
+from angr.calling_conventions import SimRegArg, SimStackArg, default_cc
+from angr.sim_type import SimTypeBottom
+from .utils import is_sane_register_variable
+class FactCollectorState:
+    """
+    The abstract state for FactCollector.
+    """
+    __slots__ = (
+        "bp_value",
+        "callee_stored_regs",
+        "reg_reads",
+        "reg_writes",
+        "simple_stack",
+        "sp_value",
+        "stack_reads",
+        "stack_writes",
+        "tmps",
+    )
+    def __init__(self):
+        self.tmps = {}
+        self.simple_stack = {}
+        self.callee_stored_regs: dict[int, int] = {}  # reg offset -> stack offset
+        self.reg_reads = {}
+        self.reg_writes: set[int] = set()
+        self.stack_reads = {}
+        self.stack_writes: set[int] = set()
+        self.sp_value = 0
+        self.bp_value = 0
+    def register_read(self, offset: int, size_in_bytes: int):
+        if offset in self.reg_writes:
+            return
+        if offset not in self.reg_reads:
+            self.reg_reads[offset] = size_in_bytes
+        else:
+            self.reg_reads[offset] = max(self.reg_reads[offset], size_in_bytes)
+    def register_written(self, offset: int, size_in_bytes: int):
+        for o in range(size_in_bytes):
+            self.reg_writes.add(offset + o)
+    def stack_read(self, offset: int, size_in_bytes: int):
+        if offset in self.stack_writes:
+            return
+        if offset not in self.stack_reads:
+            self.stack_reads[offset] = size_in_bytes
+        else:
+            self.stack_reads[offset] = max(self.stack_reads[offset], size_in_bytes)
+    def stack_written(self, offset: int, size_int_bytes: int):
+        for o in range(size_int_bytes):
+            self.stack_writes.add(offset + o)
+    def copy(self, with_tmps: bool = False) -> FactCollectorState:
+        new_state = FactCollectorState()
+        new_state.reg_reads = self.reg_reads.copy()
+        new_state.stack_reads = self.stack_reads.copy()
+        new_state.stack_writes = self.stack_writes.copy()
+        new_state.reg_writes = self.reg_writes.copy()
+        new_state.callee_stored_regs = self.callee_stored_regs.copy()
+        new_state.sp_value = self.sp_value
+        new_state.bp_value = self.bp_value
+        new_state.simple_stack = self.simple_stack.copy()
+        if with_tmps:
+            new_state.tmps = self.tmps.copy()
+        return new_state
+binop_handler = SimEngineNostmtVEX[FactCollectorState, claripy.ast.BV, FactCollectorState].binop_handler
+class SimEngineFactCollectorVEX(
+    SimEngineNostmtVEX[FactCollectorState, SpOffset | RegisterOffset | int, None],
+    SimEngineLight[type[FactCollectorState], SpOffset | RegisterOffset | int, Block, None],
+):
+    """
+    THe engine for FactCollector.
+    """
+    def __init__(self, project, bp_as_gpr: bool):
+        self.bp_as_gpr = bp_as_gpr
+        super().__init__(project)
+    def _process_block_end(self, stmt_result: list, whitelist: set[int] | None) -> None:
+        if self.block.vex.jumpkind == "Ijk_Call":
+            self.state.register_written(self.arch.ret_offset, self.arch.bytes)
+    def _top(self, bits: int):
+        return None
+    def _is_top(self, expr: Any) -> bool:
+        raise NotImplementedError
+    def _handle_conversion(self, from_size: int, to_size: int, signed: bool, operand: pyvex.IRExpr) -> Any:
+        return None
+    def _handle_stmt_Put(self, stmt):
+        v = self._expr(stmt.data)
+        if stmt.offset == self.arch.sp_offset and isinstance(v, SpOffset):
+            self.state.sp_value = v.offset
+        elif stmt.offset == self.arch.bp_offset and isinstance(v, SpOffset):
+            self.state.bp_value = v.offset
+        else:
+            self.state.register_written(stmt.offset, stmt.data.result_size(self.tyenv) // self.arch.byte_width)
+    def _handle_stmt_Store(self, stmt: pyvex.IRStmt.Store):
+        addr = self._expr(stmt.addr)
+        if isinstance(addr, SpOffset):
+            self.state.stack_written(addr.offset, stmt.data.result_size(self.tyenv) // self.arch.byte_width)
+            data = self._expr(stmt.data)
+            if isinstance(data, RegisterOffset) and not isinstance(data, SpOffset):
+                # push reg; we record the stored register as well as the stack slot offset
+                self.state.callee_stored_regs[data.reg] = u2s(addr.offset, self.arch.bits)
+            if isinstance(data, SpOffset):
+                self.state.simple_stack[addr.offset] = data
+    def _handle_stmt_WrTmp(self, stmt: pyvex.IRStmt.WrTmp):
+        v = self._expr(stmt.data)
+        if v is not None:
+            self.state.tmps[stmt.tmp] = v
+    def _handle_expr_Const(self, expr: pyvex.IRExpr.Const):
+        return expr.con.value
+    def _handle_expr_GSPTR(self, expr):
+        return None
+    def _handle_expr_Get(self, expr) -> SpOffset | None:
+        if expr.offset == self.arch.sp_offset:
+            return SpOffset(self.arch.bits, self.state.sp_value, is_base=False)
+        if expr.offset == self.arch.bp_offset and not self.bp_as_gpr:
+            return SpOffset(self.arch.bits, self.state.bp_value, is_base=False)
+        bits = expr.result_size(self.tyenv)
+        self.state.register_read(expr.offset, bits // self.arch.byte_width)
+        return RegisterOffset(bits, expr.offset, 0)
+    def _handle_expr_GetI(self, expr):
+        return None
+    def _handle_expr_ITE(self, expr):
+        return None
+    def _handle_expr_Load(self, expr):
+        addr = self._expr(expr.addr)
+        if isinstance(addr, SpOffset):
+            self.state.stack_read(addr.offset, expr.result_size(self.tyenv) // self.arch.byte_width)
+            return self.state.simple_stack.get(addr.offset)
+        return None
+    def _handle_expr_RdTmp(self, expr):
+        return self.state.tmps.get(expr.tmp, None)
+    def _handle_expr_VECRET(self, expr):
+        return None
+    @binop_handler
+    def _handle_binop_Add(self, expr):
+        op0, op1 = self._expr(expr.args[0]), self._expr(expr.args[1])
+        if isinstance(op0, SpOffset) and isinstance(op1, int):
+            return SpOffset(op0.bits, s2u(op0.offset + op1, op0.bits), is_base=op0.is_base)
+        if isinstance(op1, SpOffset) and isinstance(op0, int):
+            return SpOffset(op1.bits, s2u(op1.offset + op0, op1.bits), is_base=op1.is_base)
+        return None
+    @binop_handler
+    def _handle_binop_Sub(self, expr):
+        op0, op1 = self._expr(expr.args[0]), self._expr(expr.args[1])
+        if isinstance(op0, SpOffset) and isinstance(op1, int):
+            return SpOffset(op0.bits, s2u(op0.offset - op1, op0.bits), is_base=op0.is_base)
+        if isinstance(op1, SpOffset) and isinstance(op0, int):
+            return SpOffset(op1.bits, s2u(op1.offset - op0, op1.bits), is_base=op1.is_base)
+        return None
+    @binop_handler
+    def _handle_binop_And(self, expr):
+        op0, op1 = self._expr(expr.args[0]), self._expr(expr.args[1])
+        if isinstance(op0, SpOffset):
+            return op0
+        if isinstance(op1, SpOffset):
+            return op1
+        return None
+class FactCollector(Analysis):
+    """
+    An extremely fast analysis that extracts necessary facts of a function for CallingConventionAnalysis to make
+    decision on the calling convention and prototype of a function.
+    """
+    def __init__(self, func: Function, max_depth: int = 5):
+        self.function = func
+        self._max_depth = max_depth
+        self.input_args: list[SimRegArg | SimStackArg] | None = None
+        self.retval_size: int | None = None
+        self._analyze()
+    def _analyze(self):
+        # breadth-first search using function graph, collect registers and stack variables that are written to as well
+        # as read from, until max_depth is reached
+        end_states = self._analyze_startpoint()
+        self._analyze_endpoints_for_retval_size()
+        callee_restored_regs = self._analyze_endpoints_for_restored_regs()
+        self._determine_input_args(end_states, callee_restored_regs)
+    def _analyze_startpoint(self):
+        func_graph = self.function.transition_graph
+        startpoint = self.function.startpoint
+        bp_as_gpr = self.function.info.get("bp_as_gpr", False)
+        engine = SimEngineFactCollectorVEX(self.project, bp_as_gpr)
+        init_state = FactCollectorState()
+        if self.project.arch.call_pushes_ret:
+            init_state.sp_value = self.project.arch.bytes
+        init_state.bp_value = init_state.sp_value
+        traversed = set()
+        queue: list[tuple[int, FactCollectorState, BlockNode | HookNode | Function, BlockNode | HookNode | None]] = [
+            (0, init_state, startpoint, None)
+        ]
+        end_states: list[FactCollectorState] = []
+        while queue:
+            depth, state, node, retnode = queue.pop(0)
+            traversed.add(node)
+            if depth > self._max_depth:
+                end_states.append(state)
+                break
+            if isinstance(node, BlockNode) and node.size == 0:
+                continue
+            if isinstance(node, HookNode):
+                # attempt to convert it into a function
+                if self.kb.functions.contains_addr(node.addr):
+                    node = self.kb.functions.get_by_addr(node.addr)
+                else:
+                    continue
+            if isinstance(node, Function):
+                if node.calling_convention is not None and node.prototype is not None:
+                    # consume args and overwrite the return register
+                    self._handle_function(state, node)
+                if node.returning is False or retnode is None:
+                    # the function call does not return
+                    end_states.append(state)
+                else:
+                    # enqueue the retnode, but we don't increment the depth
+                    new_state = state.copy()
+                    if self.project.arch.call_pushes_ret:
+                        new_state.sp_value += self.project.arch.bytes
+                    queue.append((depth, new_state, retnode, None))
+                continue
+            block = self.project.factory.block(node.addr, size=node.size)
+            engine.process(state, block=block)
+            successor_added = False
+            call_succ, ret_succ = None, None
+            for _, succ, data in func_graph.out_edges(node, data=True):
+                edge_type = data.get("type")
+                if succ not in traversed and depth + 1 <= self._max_depth:
+                    if edge_type == "fake_return":
+                        ret_succ = succ
+                    elif edge_type == "transition":
+                        successor_added = True
+                        queue.append((depth + 1, state.copy(), succ, None))
+                    elif edge_type == "call":
+                        call_succ = succ
+            if call_succ is not None:
+                successor_added = True
+                queue.append((depth + 1, state.copy(), call_succ, ret_succ))
+            if not successor_added:
+                end_states.append(state)
+        return end_states
+    def _handle_function(self, state: FactCollectorState, func: Function) -> None:
+        try:
+            arg_locs = func.calling_convention.arg_locs(func.prototype)
+        except (TypeError, ValueError):
+            return
+        if None in arg_locs:
+            return
+        for arg_loc in arg_locs:
+            for loc in arg_loc.get_footprint():
+                if isinstance(loc, SimRegArg):
+                    state.register_read(self.project.arch.registers[loc.reg_name][0] + loc.reg_offset, loc.size)
+                elif isinstance(loc, SimStackArg):
+                    sp_value = state.sp_value
+                    if sp_value is not None:
+                        state.stack_read(sp_value + loc.stack_offset, loc.size)
+        # clobber caller-saved regs
+        for reg_name in func.calling_convention.CALLER_SAVED_REGS:
+            offset = self.project.arch.registers[reg_name][0]
+            state.register_written(offset, self.project.arch.registers[reg_name][1])
+    def _analyze_endpoints_for_retval_size(self):
+        """
+        Analyze all endpoints to determine the return value size.
+        """
+        func_graph = self.function.transition_graph
+        cc_cls = default_cc(
+            self.project.arch.name, platform=self.project.simos.name if self.project.simos is not None else None
+        )
+        cc = cc_cls(self.project.arch)
+        if isinstance(cc.RETURN_VAL, SimRegArg):
+            retreg_offset = cc.RETURN_VAL.check_offset(self.project.arch)
+        else:
+            return
+        retval_sizes = []
+        for endpoint in self.function.endpoints:
+            traversed = set()
+            queue: list[tuple[int, BlockNode | HookNode]] = [(0, endpoint)]
+            while queue:
+                depth, node = queue.pop(0)
+                traversed.add(node)
+                if depth > 3:
+                    break
+                if isinstance(node, BlockNode) and node.size == 0:
+                    continue
+                if isinstance(node, HookNode):
+                    # attempt to convert it into a function
+                    if self.kb.functions.contains_addr(node.addr):
+                        node = self.kb.functions.get_by_addr(node.addr)
+                    else:
+                        continue
+                if isinstance(node, Function):
+                    if (
+                        node.calling_convention is not None
+                        and node.prototype is not None
+                        and node.prototype.returnty is not None
+                        and not isinstance(node.prototype.returnty, SimTypeBottom)
+                    ):
+                        # assume the function overwrites the return variable
+                        retval_size = (
+                            node.prototype.returnty.with_arch(self.project.arch).size // self.project.arch.byte_width
+                        )
+                        retval_sizes.append(retval_size)
+                    continue
+                block = self.project.factory.block(node.addr, size=node.size)
+                # scan the block statements backwards to find writes to the return value register
+                retval_size = None
+                for stmt in reversed(block.vex.statements):
+                    if isinstance(stmt, pyvex.IRStmt.Put):
+                        size = stmt.data.result_size(block.vex.tyenv) // self.project.arch.byte_width
+                        if stmt.offset == retreg_offset:
+                            retval_size = max(size, 1)
+                if retval_size is not None:
+                    retval_sizes.append(retval_size)
+                    continue
+                for pred, _, data in func_graph.in_edges(node, data=True):
+                    edge_type = data.get("type")
+                    if pred not in traversed and depth + 1 <= self._max_depth:
+                        if edge_type == "fake_return":
+                            continue
+                        if edge_type in {"transition", "call"}:
+                            queue.append((depth + 1, pred))
+        self.retval_size = max(retval_sizes) if retval_sizes else None
+    def _analyze_endpoints_for_restored_regs(self):
+        """
+        Analyze all endpoints to determine the restored registers.
+        """
+        func_graph = self.function.transition_graph
+        callee_restored_regs = set()
+        for endpoint in self.function.endpoints:
+            traversed = set()
+            queue: list[tuple[int, BlockNode | HookNode]] = [(0, endpoint)]
+            while queue:
+                depth, node = queue.pop(0)
+                traversed.add(node)
+                if depth > 3:
+                    break
+                if isinstance(node, BlockNode) and node.size == 0:
+                    continue
+                if isinstance(node, (HookNode, Function)):
+                    continue
+                block = self.project.factory.block(node.addr, size=node.size)
+                # scan the block statements backwards to find all statements that restore registers from the stack
+                tmps = {}
+                for stmt in block.vex.statements:
+                    if isinstance(stmt, pyvex.IRStmt.WrTmp):
+                        if isinstance(stmt.data, pyvex.IRExpr.Get) and stmt.data.offset in {
+                            self.project.arch.bp_offset,
+                            self.project.arch.sp_offset,
+                        }:
+                            tmps[stmt.tmp] = "sp"
+                        elif (
+                            isinstance(stmt.data, pyvex.IRExpr.Load)
+                            and isinstance(stmt.data.addr, pyvex.IRExpr.RdTmp)
+                            and tmps.get(stmt.data.addr.tmp) == "sp"
+                        ):
+                            tmps[stmt.tmp] = "stack_value"
+                        elif isinstance(stmt.data, pyvex.IRExpr.Const):
+                            tmps[stmt.tmp] = "const"
+                        elif isinstance(stmt.data, pyvex.IRExpr.Binop) and (  # noqa:SIM102
+                            stmt.data.op.startswith("Iop_Add") or stmt.data.op.startswith("Iop_Sub")
+                        ):
+                            if (
+                                isinstance(stmt.data.args[0], pyvex.IRExpr.RdTmp)
+                                and tmps.get(stmt.data.args[0].tmp) == "sp"
+                            ) or (
+                                isinstance(stmt.data.args[1], pyvex.IRExpr.RdTmp)
+                                and tmps.get(stmt.data.args[1].tmp) == "sp"
+                            ):
+                                tmps[stmt.tmp] = "sp"
+                    if isinstance(stmt, pyvex.IRStmt.Put):
+                        size = stmt.data.result_size(block.vex.tyenv) // self.project.arch.byte_width
+                        # is the data loaded from the stack?
+                        if (
+                            size == self.project.arch.bytes
+                            and isinstance(stmt.data, pyvex.IRExpr.RdTmp)
+                            and tmps.get(stmt.data.tmp) == "stack_value"
+                        ):
+                            callee_restored_regs.add(stmt.offset)
+                for pred, _, data in func_graph.in_edges(node, data=True):
+                    edge_type = data.get("type")
+                    if pred not in traversed and depth + 1 <= self._max_depth and edge_type == "transition":
+                        queue.append((depth + 1, pred))
+        return callee_restored_regs
+    def _determine_input_args(self, end_states: list[FactCollectorState], callee_restored_regs: set[int]) -> None:
+        self.input_args = []
+        reg_offset_created = set()
+        callee_saved_regs = set()
+        callee_saved_reg_stack_offsets = set()
+        # determine callee-saved registers
+        for state in end_states:
+            for reg_offset, stack_offset in state.callee_stored_regs.items():
+                if reg_offset in callee_restored_regs:
+                    callee_saved_regs.add(reg_offset)
+                    callee_saved_reg_stack_offsets.add(stack_offset)
+        for state in end_states:
+            for offset, size in state.reg_reads.items():
+                if (
+                    offset in reg_offset_created
+                    or offset == self.project.arch.bp_offset
+                    or not is_sane_register_variable(self.project.arch, offset, size)
+                    or offset in callee_saved_regs
+                ):
+                    continue
+                reg_offset_created.add(offset)
+                if self.project.arch.name in {"AMD64", "X86"} and size < self.project.arch.bytes:
+                    # use complete registers on AMD64 and X86
+                    reg_name = self.project.arch.translate_register_name(offset, size=self.project.arch.bytes)
+                    arg = SimRegArg(reg_name, self.project.arch.bytes)
+                else:
+                    reg_name = self.project.arch.translate_register_name(offset, size=size)
+                    arg = SimRegArg(reg_name, size)
+                self.input_args.append(arg)
+        stack_offset_created = set()
+        ret_addr_offset = 0 if not self.project.arch.call_pushes_ret else self.project.arch.bytes
+        for state in end_states:
+            for offset, size in state.stack_reads.items():
+                offset = u2s(offset, self.project.arch.bits)
+                if offset - ret_addr_offset > 0:
+                    if offset in stack_offset_created or offset in callee_saved_reg_stack_offsets:
+                        continue
+                    stack_offset_created.add(offset)
+                    arg = SimStackArg(offset - ret_addr_offset, size)
+                    self.input_args.append(arg)
+AnalysesHub.register_default("FunctionFactCollector", FactCollector)

angr/analyses/calling_convention/utils.py ADDED Viewed

@@ -0,0 +1,57 @@
+from __future__ import annotations
+import logging
+import archinfo
+from archinfo.arch_arm import is_arm_arch, ArchARMHF
+from angr.calling_conventions import SimCC
+l = logging.getLogger(__name__)
+def is_sane_register_variable(arch: archinfo.Arch, reg_offset: int, reg_size: int, def_cc: SimCC | None = None) -> bool:
+    """
+    Filters all registers that are surly not members of function arguments.
+    This can be seen as a workaround, since VariableRecoveryFast sometimes gives input variables of cc_ndep (which
+    is a VEX-specific register) :-(
+    :param reg_offset:  The register offset.
+    :param reg_size:    The register size.
+    :return:            True if it is an acceptable function argument, False otherwise.
+    :rtype:             bool
+    """
+    arch_name = arch.name
+    if ":" in arch_name:
+        # for pcode architectures, we only leave registers that are known to be used as input arguments
+        if def_cc is not None:
+            return arch.translate_register_name(reg_offset, size=reg_size) in def_cc.ARG_REGS
+        return True
+    # VEX
+    if arch_name == "AARCH64":
+        return 16 <= reg_offset < 80  # x0-x7
+    if arch_name == "AMD64":
+        return 24 <= reg_offset < 40 or 64 <= reg_offset < 104  # rcx, rdx  # rsi, rdi, r8, r9, r10
+        # 224 <= reg_offset < 480)  # xmm0-xmm7
+    if is_arm_arch(arch):
+        if isinstance(arch, ArchARMHF):
+            return 8 <= reg_offset < 24 or 128 <= reg_offset < 160  # r0 - 32  # s0 - s7, or d0 - d4
+        return 8 <= reg_offset < 24  # r0-r3
+    if arch_name == "MIPS32":
+        return 24 <= reg_offset < 40  # a0-a3
+    if arch_name == "MIPS64":
+        return 48 <= reg_offset < 80 or 112 <= reg_offset < 208  # a0-a3 or t4-t7
+    if arch_name == "PPC32":
+        return 28 <= reg_offset < 60  # r3-r10
+    if arch_name == "X86":
+        return 8 <= reg_offset < 24 or 160 <= reg_offset < 288  # eax, ebx, ecx, edx  # xmm0-xmm7
+    l.critical("Unsupported architecture %s.", arch.name)
+    return True

angr/analyses/cdg.py CHANGED Viewed

@@ -3,6 +3,7 @@ import logging
 import networkx
+from angr.analyses import AnalysesHub
 from angr.utils.graph import compute_dominance_frontier, PostDominators, TemporaryNode
 from . import Analysis
@@ -185,6 +186,4 @@ class CDG(Analysis):
                     _l.debug("%s is not in post dominator dict.", b2)
-from angr.analyses import AnalysesHub
 AnalysesHub.register_default("CDG", CDG)

angr/analyses/cfg/cfb.py CHANGED Viewed

@@ -6,9 +6,9 @@ from collections.abc import Callable
 import cle
 from cle.backends.externs import KernelObject, ExternObject
 from cle.backends.tls.elf_tls import ELFTLSObject
 from sortedcontainers import SortedDict
+from angr.analyses import AnalysesHub
 from angr.knowledge_plugins.cfg.memory_data import MemoryDataSort, MemoryData
 from angr.analyses.analysis import Analysis
@@ -424,7 +424,5 @@ class CFBlanket(Analysis):
                 addr = max_addr
-from angr.analyses import AnalysesHub
 AnalysesHub.register_default("CFB", CFBlanket)
 AnalysesHub.register_default("CFBlanket", CFBlanket)

angr/analyses/cfg/cfg.py CHANGED Viewed

@@ -1,6 +1,8 @@
 from __future__ import annotations
 import sys
+from angr.analyses import AnalysesHub
 from .cfg_fast import CFGFast
@@ -69,6 +71,4 @@ class CFG(CFGFast):  # pylint: disable=abstract-method
         CFGFast.__init__(self, **kwargs)
-from angr.analyses import AnalysesHub
 AnalysesHub.register_default("CFG", CFG)