PyPI - crosshair-tool - Versions diffs - 0.0.99__cp312-cp312-macosx_10_13_x86_64.whl - Mend

crosshair-tool 0.0.99__cp312-cp312-macosx_10_13_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (176) hide show

_crosshair_tracers.cpython-312-darwin.so +0 -0
crosshair/__init__.py +42 -0
crosshair/__main__.py +8 -0
crosshair/_mark_stacks.h +790 -0
crosshair/_preliminaries_test.py +18 -0
crosshair/_tracers.h +94 -0
crosshair/_tracers_pycompat.h +522 -0
crosshair/_tracers_test.py +138 -0
crosshair/abcstring.py +245 -0
crosshair/auditwall.py +190 -0
crosshair/auditwall_test.py +77 -0
crosshair/codeconfig.py +113 -0
crosshair/codeconfig_test.py +117 -0
crosshair/condition_parser.py +1237 -0
crosshair/condition_parser_test.py +497 -0
crosshair/conftest.py +30 -0
crosshair/copyext.py +155 -0
crosshair/copyext_test.py +84 -0
crosshair/core.py +1763 -0
crosshair/core_and_libs.py +149 -0
crosshair/core_regestered_types_test.py +82 -0
crosshair/core_test.py +1316 -0
crosshair/diff_behavior.py +314 -0
crosshair/diff_behavior_test.py +261 -0
crosshair/dynamic_typing.py +346 -0
crosshair/dynamic_typing_test.py +210 -0
crosshair/enforce.py +282 -0
crosshair/enforce_test.py +182 -0
crosshair/examples/PEP316/__init__.py +1 -0
crosshair/examples/PEP316/bugs_detected/__init__.py +0 -0
crosshair/examples/PEP316/bugs_detected/getattr_magic.py +16 -0
crosshair/examples/PEP316/bugs_detected/hash_consistent_with_equals.py +31 -0
crosshair/examples/PEP316/bugs_detected/shopping_cart.py +24 -0
crosshair/examples/PEP316/bugs_detected/showcase.py +39 -0
crosshair/examples/PEP316/correct_code/__init__.py +0 -0
crosshair/examples/PEP316/correct_code/arith.py +60 -0
crosshair/examples/PEP316/correct_code/chess.py +77 -0
crosshair/examples/PEP316/correct_code/nesting_inference.py +17 -0
crosshair/examples/PEP316/correct_code/numpy_examples.py +132 -0
crosshair/examples/PEP316/correct_code/rolling_average.py +35 -0
crosshair/examples/PEP316/correct_code/showcase.py +104 -0
crosshair/examples/__init__.py +0 -0
crosshair/examples/check_examples_test.py +146 -0
crosshair/examples/deal/__init__.py +1 -0
crosshair/examples/icontract/__init__.py +1 -0
crosshair/examples/icontract/bugs_detected/__init__.py +0 -0
crosshair/examples/icontract/bugs_detected/showcase.py +41 -0
crosshair/examples/icontract/bugs_detected/wrong_sign.py +8 -0
crosshair/examples/icontract/correct_code/__init__.py +0 -0
crosshair/examples/icontract/correct_code/arith.py +51 -0
crosshair/examples/icontract/correct_code/showcase.py +94 -0
crosshair/fnutil.py +391 -0
crosshair/fnutil_test.py +75 -0
crosshair/fuzz_core_test.py +516 -0
crosshair/libimpl/__init__.py +0 -0
crosshair/libimpl/arraylib.py +161 -0
crosshair/libimpl/binascii_ch_test.py +30 -0
crosshair/libimpl/binascii_test.py +67 -0
crosshair/libimpl/binasciilib.py +150 -0
crosshair/libimpl/bisectlib_test.py +23 -0
crosshair/libimpl/builtinslib.py +5228 -0
crosshair/libimpl/builtinslib_ch_test.py +1191 -0
crosshair/libimpl/builtinslib_test.py +3735 -0
crosshair/libimpl/codecslib.py +86 -0
crosshair/libimpl/codecslib_test.py +86 -0
crosshair/libimpl/collectionslib.py +264 -0
crosshair/libimpl/collectionslib_ch_test.py +252 -0
crosshair/libimpl/collectionslib_test.py +332 -0
crosshair/libimpl/copylib.py +23 -0
crosshair/libimpl/copylib_test.py +18 -0
crosshair/libimpl/datetimelib.py +2559 -0
crosshair/libimpl/datetimelib_ch_test.py +354 -0
crosshair/libimpl/datetimelib_test.py +112 -0
crosshair/libimpl/decimallib.py +5257 -0
crosshair/libimpl/decimallib_ch_test.py +78 -0
crosshair/libimpl/decimallib_test.py +76 -0
crosshair/libimpl/encodings/__init__.py +23 -0
crosshair/libimpl/encodings/_encutil.py +187 -0
crosshair/libimpl/encodings/ascii.py +44 -0
crosshair/libimpl/encodings/latin_1.py +40 -0
crosshair/libimpl/encodings/utf_8.py +93 -0
crosshair/libimpl/encodings_ch_test.py +83 -0
crosshair/libimpl/fractionlib.py +16 -0
crosshair/libimpl/fractionlib_test.py +80 -0
crosshair/libimpl/functoolslib.py +34 -0
crosshair/libimpl/functoolslib_test.py +56 -0
crosshair/libimpl/hashliblib.py +30 -0
crosshair/libimpl/hashliblib_test.py +18 -0
crosshair/libimpl/heapqlib.py +47 -0
crosshair/libimpl/heapqlib_test.py +21 -0
crosshair/libimpl/importliblib.py +18 -0
crosshair/libimpl/importliblib_test.py +38 -0
crosshair/libimpl/iolib.py +216 -0
crosshair/libimpl/iolib_ch_test.py +128 -0
crosshair/libimpl/iolib_test.py +19 -0
crosshair/libimpl/ipaddresslib.py +8 -0
crosshair/libimpl/itertoolslib.py +44 -0
crosshair/libimpl/itertoolslib_test.py +44 -0
crosshair/libimpl/jsonlib.py +984 -0
crosshair/libimpl/jsonlib_ch_test.py +42 -0
crosshair/libimpl/jsonlib_test.py +51 -0
crosshair/libimpl/mathlib.py +179 -0
crosshair/libimpl/mathlib_ch_test.py +44 -0
crosshair/libimpl/mathlib_test.py +67 -0
crosshair/libimpl/oslib.py +7 -0
crosshair/libimpl/pathliblib_test.py +10 -0
crosshair/libimpl/randomlib.py +178 -0
crosshair/libimpl/randomlib_test.py +120 -0
crosshair/libimpl/relib.py +846 -0
crosshair/libimpl/relib_ch_test.py +169 -0
crosshair/libimpl/relib_test.py +493 -0
crosshair/libimpl/timelib.py +72 -0
crosshair/libimpl/timelib_test.py +82 -0
crosshair/libimpl/typeslib.py +15 -0
crosshair/libimpl/typeslib_test.py +36 -0
crosshair/libimpl/unicodedatalib.py +75 -0
crosshair/libimpl/unicodedatalib_test.py +42 -0
crosshair/libimpl/urlliblib.py +23 -0
crosshair/libimpl/urlliblib_test.py +19 -0
crosshair/libimpl/weakreflib.py +13 -0
crosshair/libimpl/weakreflib_test.py +69 -0
crosshair/libimpl/zliblib.py +15 -0
crosshair/libimpl/zliblib_test.py +13 -0
crosshair/lsp_server.py +261 -0
crosshair/lsp_server_test.py +30 -0
crosshair/main.py +973 -0
crosshair/main_test.py +543 -0
crosshair/objectproxy.py +376 -0
crosshair/objectproxy_test.py +41 -0
crosshair/opcode_intercept.py +601 -0
crosshair/opcode_intercept_test.py +304 -0
crosshair/options.py +218 -0
crosshair/options_test.py +10 -0
crosshair/patch_equivalence_test.py +75 -0
crosshair/path_cover.py +209 -0
crosshair/path_cover_test.py +138 -0
crosshair/path_search.py +161 -0
crosshair/path_search_test.py +52 -0
crosshair/pathing_oracle.py +271 -0
crosshair/pathing_oracle_test.py +21 -0
crosshair/pure_importer.py +27 -0
crosshair/pure_importer_test.py +16 -0
crosshair/py.typed +0 -0
crosshair/register_contract.py +273 -0
crosshair/register_contract_test.py +190 -0
crosshair/simplestructs.py +1165 -0
crosshair/simplestructs_test.py +283 -0
crosshair/smtlib.py +24 -0
crosshair/smtlib_test.py +14 -0
crosshair/statespace.py +1199 -0
crosshair/statespace_test.py +108 -0
crosshair/stubs_parser.py +352 -0
crosshair/stubs_parser_test.py +43 -0
crosshair/test_util.py +329 -0
crosshair/test_util_test.py +26 -0
crosshair/tools/__init__.py +0 -0
crosshair/tools/check_help_in_doc.py +264 -0
crosshair/tools/check_init_and_setup_coincide.py +119 -0
crosshair/tools/generate_demo_table.py +127 -0
crosshair/tracers.py +544 -0
crosshair/tracers_test.py +154 -0
crosshair/type_repo.py +151 -0
crosshair/unicode_categories.py +589 -0
crosshair/unicode_categories_test.py +27 -0
crosshair/util.py +741 -0
crosshair/util_test.py +173 -0
crosshair/watcher.py +307 -0
crosshair/watcher_test.py +107 -0
crosshair/z3util.py +76 -0
crosshair/z3util_test.py +11 -0
crosshair_tool-0.0.99.dist-info/METADATA +144 -0
crosshair_tool-0.0.99.dist-info/RECORD +176 -0
crosshair_tool-0.0.99.dist-info/WHEEL +6 -0
crosshair_tool-0.0.99.dist-info/entry_points.txt +3 -0
crosshair_tool-0.0.99.dist-info/licenses/LICENSE +93 -0
crosshair_tool-0.0.99.dist-info/top_level.txt +2 -0

crosshair/diff_behavior.py ADDED Viewed

@@ -0,0 +1,314 @@
+import copy
+import dataclasses
+import dis
+import enum
+import inspect
+import sys
+import time
+from typing import Any, Callable, Dict, Iterable, List, Optional, Set, Tuple, Union
+from crosshair import IgnoreAttempt
+from crosshair.condition_parser import condition_parser
+from crosshair.core import ExceptionFilter, Patched, deep_realize, gen_args
+from crosshair.fnutil import FunctionInfo
+from crosshair.options import AnalysisOptions
+from crosshair.statespace import (
+    CallAnalysis,
+    RootNode,
+    StateSpace,
+    StateSpaceContext,
+    VerificationStatus,
+)
+from crosshair.test_util import flexible_equal
+from crosshair.tracers import (
+    COMPOSITE_TRACER,
+    CoverageResult,
+    CoverageTracingModule,
+    NoTracing,
+    PushedModule,
+    ResumedTracing,
+)
+from crosshair.util import CrosshairUnsupported, IgnoreAttempt, UnexploredPath, debug
+class ExceptionEquivalenceType(enum.Enum):
+    ALL = "ALL"
+    SAME_TYPE = "SAME_TYPE"
+    TYPE_AND_MESSAGE = "TYPE_AND_MESSAGE"
+@dataclasses.dataclass
+class Result:
+    return_repr: str
+    error: Optional[str]
+    post_execution_args: Dict[str, str]
+    def get_differing_arg_mutations(self, other: "Result") -> Set[str]:
+        args1 = self.post_execution_args
+        args2 = other.post_execution_args
+        differing_args: Set[str] = set()
+        for arg in set(args1.keys()) | args2.keys():
+            if arg in args1 and arg in args2 and args1[arg] != args2[arg]:
+                differing_args.add(arg)
+        return differing_args
+    def describe(self, args_to_show: Set[str]) -> str:
+        ret = []
+        if self.error is not None:
+            ret.append(f"raises {self.error}")
+        if self.return_repr != "None":
+            ret.append(f"returns {self.return_repr}")
+        if args_to_show:
+            if ret:
+                ret.append(", ")
+            ret.append("after execution ")
+            ret.append(
+                ", ".join(
+                    f"{arg}={self.post_execution_args[arg]}" for arg in args_to_show
+                )
+            )
+        # last resort, be explicit about returning none:
+        if not ret:
+            ret.append("returns None")
+        return "".join(ret)
+def describe_behavior(
+    fn: Callable, args: inspect.BoundArguments
+) -> Tuple[Any, Optional[BaseException]]:
+    with ExceptionFilter() as efilter:
+        ret = fn(*args.args, **args.kwargs)
+        return (ret, None)
+    if efilter.user_exc is not None:
+        exc = efilter.user_exc[0]
+        debug("user-level exception found", repr(exc), *efilter.user_exc[1])
+        return (None, exc)
+    if efilter.ignore:
+        return (None, IgnoreAttempt())
+    assert False
+@dataclasses.dataclass
+class BehaviorDiff:
+    args: Dict[str, str]
+    result1: Result
+    result2: Result
+    coverage1: CoverageResult
+    coverage2: CoverageResult
+    def reverse(self) -> "BehaviorDiff":
+        return BehaviorDiff(
+            self.args, self.result2, self.result1, self.coverage2, self.coverage1
+        )
+def diff_scorer(
+    check_opcodes1: Set[int], check_opcodes2: Set[int]
+) -> Callable[[BehaviorDiff], Tuple[float, float]]:
+    """
+    Create a function to score the usefulness of behavior diffs.
+    We aim for a minimal number of examples that gives as much coverage of the
+    differing opcodes as possible.
+    We break ties on smaller examples. (repr-string-length-wise)
+    """
+    pass  # for pydocstyle
+    def scorer(diff: BehaviorDiff) -> Tuple[float, float]:
+        coverage1 = diff.coverage1
+        coverage2 = diff.coverage2
+        total_opcodes = len(coverage1.all_offsets) + len(coverage2.all_offsets)
+        cover1 = len(coverage1.offsets_covered & check_opcodes1)
+        cover2 = len(coverage2.offsets_covered & check_opcodes2)
+        cover_score = (cover1 + cover2) / total_opcodes
+        strlen_score = len(str(diff))
+        return (cover_score, strlen_score)
+    return scorer
+def diff_behavior(
+    ctxfn1: FunctionInfo,
+    ctxfn2: FunctionInfo,
+    options: AnalysisOptions,
+    exception_equivalence: ExceptionEquivalenceType = ExceptionEquivalenceType.TYPE_AND_MESSAGE,
+) -> Union[str, List[BehaviorDiff]]:
+    fn1, sig1 = ctxfn1.callable()
+    fn2, sig2 = ctxfn2.callable()
+    debug("Resolved signature:", sig1)
+    all_diffs: List[BehaviorDiff] = []
+    half1, half2 = options.split_limits(0.5)
+    with condition_parser(
+        options.analysis_kind
+    ), Patched(), COMPOSITE_TRACER, NoTracing():
+        # We attempt both orderings of functions. This helps by:
+        # (1) avoiding code path explosions in one of the functions
+        # (2) using both signatures (in case they differ)
+        all_diffs.extend(
+            diff_behavior_with_signature(fn1, fn2, sig1, half1, exception_equivalence)
+        )
+        all_diffs.extend(
+            diff.reverse()
+            for diff in diff_behavior_with_signature(
+                fn2, fn1, sig2, half2, exception_equivalence
+            )
+        )
+    debug("diff candidates:", all_diffs)
+    # greedily pick results:
+    result_diffs = []
+    opcodeset1 = set(i.offset for i in dis.get_instructions(fn1.__code__))
+    opcodeset2 = set(i.offset for i in dis.get_instructions(fn2.__code__))
+    while all_diffs:
+        scorer = diff_scorer(opcodeset1, opcodeset2)
+        selection = max(all_diffs, key=scorer)
+        (num_opcodes, _) = scorer(selection)
+        debug("Considering input", selection.args, " num opcodes=", num_opcodes)
+        if num_opcodes == 0:
+            break
+        all_diffs.remove(selection)
+        result_diffs.append(selection)
+        coverage1, coverage2 = selection.coverage1, selection.coverage2
+        if coverage1 is not None and coverage2 is not None:
+            opcodeset1 -= coverage1.offsets_covered
+            opcodeset2 -= coverage2.offsets_covered
+    return result_diffs
+def diff_behavior_with_signature(
+    fn1: Callable,
+    fn2: Callable,
+    sig: inspect.Signature,
+    options: AnalysisOptions,
+    exception_equivalence: ExceptionEquivalenceType,
+) -> Iterable[BehaviorDiff]:
+    search_root = RootNode()
+    condition_start = time.monotonic()
+    max_uninteresting_iterations = options.get_max_uninteresting_iterations()
+    for i in range(1, options.max_iterations):
+        debug("Iteration ", i)
+        itr_start = time.monotonic()
+        if itr_start > condition_start + options.per_condition_timeout:
+            debug(
+                "Stopping due to --per_condition_timeout=",
+                options.per_condition_timeout,
+            )
+            return
+        options.incr("num_paths")
+        per_path_timeout = options.get_per_path_timeout()
+        space = StateSpace(
+            execution_deadline=itr_start + per_path_timeout,
+            model_check_timeout=per_path_timeout / 2,
+            search_root=search_root,
+        )
+        with StateSpaceContext(space):
+            output = None
+            try:
+                with ResumedTracing():
+                    (verification_status, output) = run_iteration(
+                        fn1, fn2, sig, space, exception_equivalence
+                    )
+            except IgnoreAttempt:
+                verification_status = None
+            except UnexploredPath:
+                verification_status = VerificationStatus.UNKNOWN
+            debug("Verification status:", verification_status)
+            top_analysis, exhausted = space.bubble_status(
+                CallAnalysis(verification_status)
+            )
+            if output:
+                yield output
+            if exhausted:
+                debug("Stopping due to code path exhaustion. (yay!)")
+                options.incr("exhaustion")
+                break
+            if max_uninteresting_iterations != sys.maxsize:
+                iters_since_discovery = getattr(
+                    search_root.pathing_oracle, "iters_since_discovery"
+                )
+                assert isinstance(iters_since_discovery, int)
+                debug("iters_since_discovery", iters_since_discovery)
+                if iters_since_discovery > max_uninteresting_iterations:
+                    debug(
+                        "Stopping due to --max_uninteresting_iterations=",
+                        max_uninteresting_iterations,
+                    )
+                    break
+def check_exception_equivalence(
+    exception_equivalence_type: ExceptionEquivalenceType,
+    exc1: Optional[BaseException],
+    exc2: Optional[BaseException],
+) -> bool:
+    if exc1 is not None and exc2 is not None:
+        if exception_equivalence_type == ExceptionEquivalenceType.ALL:
+            return True
+        elif exception_equivalence_type == ExceptionEquivalenceType.SAME_TYPE:
+            return type(exc1) == type(exc2)
+        elif exception_equivalence_type == ExceptionEquivalenceType.TYPE_AND_MESSAGE:
+            return repr(exc1) == repr(exc2)
+        else:
+            raise CrosshairUnsupported("Invalid exception_equivalence type")
+    else:
+        return (exc1 is None) and (exc2 is None)
+def run_iteration(
+    fn1: Callable,
+    fn2: Callable,
+    sig: inspect.Signature,
+    space: StateSpace,
+    exception_equivalence: ExceptionEquivalenceType,
+) -> Tuple[Optional[VerificationStatus], Optional[BehaviorDiff]]:
+    with NoTracing():
+        original_args = gen_args(sig)
+    args1 = copy.deepcopy(original_args)
+    args2 = copy.deepcopy(original_args)
+    with NoTracing():
+        coverage_manager = CoverageTracingModule(fn1, fn2)
+    with ExceptionFilter() as efilter, PushedModule(coverage_manager):
+        return1, exc1 = describe_behavior(fn1, args1)
+        return2, exc2 = describe_behavior(fn2, args2)
+        if (
+            flexible_equal(return1, return2)
+            and flexible_equal(args1.arguments, args2.arguments)
+            and check_exception_equivalence(exception_equivalence, exc1, exc2)
+        ):
+            # Functions are equivalent if both have the same result,
+            # and deemed to have the same kind of error.
+            space.detach_path()
+            debug("Functions equivalent")
+            return (VerificationStatus.CONFIRMED, None)
+        space.detach_path()
+        debug("Functions differ")
+        realized_args = {
+            k: repr(deep_realize(v)) for (k, v) in original_args.arguments.items()
+        }
+        post_execution_args1 = {
+            k: repr(deep_realize(v)) for k, v in args1.arguments.items()
+        }
+        post_execution_args2 = {
+            k: repr(deep_realize(v)) for k, v in args2.arguments.items()
+        }
+        diff = BehaviorDiff(
+            realized_args,
+            Result(
+                repr(deep_realize(return1)),
+                repr(deep_realize(exc1)) if exc1 is not None else None,
+                post_execution_args1,
+            ),
+            Result(
+                repr(deep_realize(return2)),
+                repr(deep_realize(exc2)) if exc2 is not None else None,
+                post_execution_args2,
+            ),
+            coverage_manager.get_results(fn1),
+            coverage_manager.get_results(fn2),
+        )
+        return (VerificationStatus.REFUTED, diff)
+    if efilter.user_exc:
+        debug(
+            "User-level exception found", repr(efilter.user_exc[0]), efilter.user_exc[1]
+        )
+    return (None, None)

crosshair/diff_behavior_test.py ADDED Viewed

@@ -0,0 +1,261 @@
+from typing import Callable, List, Optional
+from crosshair.diff_behavior import (
+    BehaviorDiff,
+    ExceptionEquivalenceType,
+    diff_behavior,
+)
+from crosshair.fnutil import FunctionInfo, walk_qualname
+from crosshair.options import DEFAULT_OPTIONS
+from crosshair.util import debug, set_debug
+def _foo1(x: int) -> int:
+    if x >= 100:
+        return 100
+    return x
+foo1 = FunctionInfo.from_fn(_foo1)
+def _foo2(x: int) -> int:
+    return min(x, 100)
+foo2 = FunctionInfo.from_fn(_foo2)
+def _foo3(x: int) -> int:
+    if x > 1000:
+        return 1000
+    elif x > 100:
+        return 100
+    else:
+        return x
+foo3 = FunctionInfo.from_fn(_foo3)
+class Base:
+    def foo(self):
+        return 10
+    @staticmethod
+    def staticfoo(x: int) -> int:
+        return min(x, 100)
+class Derived(Base):
+    def foo(self):
+        return 11
+def _sum_list_original(int_list):
+    count = 0
+    for i in int_list:
+        count += i
+    return count
+def _sum_list_rewrite(int_list):
+    count = 0
+    for i in range(len(int_list)):
+        count += int_list[i]
+    return count
+def _sum_list_rewrite_2(int_list):
+    class CustomException(Exception):
+        pass
+    try:
+        count = 0
+        for i in range(len(int_list)):
+            count += int_list[i]
+    except:  # noqa E722
+        raise CustomException()
+    return count
+class TestBehaviorDiff:
+    def test_diff_method(self):
+        diffs = diff_behavior(
+            walk_qualname(Base, "foo"),
+            walk_qualname(Derived, "foo"),
+            DEFAULT_OPTIONS.overlay(max_iterations=10),
+        )
+        assert isinstance(diffs, list)
+        assert [(d.result1.return_repr, d.result2.return_repr) for d in diffs] == [
+            ("10", "11")
+        ]
+    def test_diff_staticmethod(self):
+        diffs = diff_behavior(
+            walk_qualname(Base, "staticfoo"),
+            foo2,
+            DEFAULT_OPTIONS.overlay(max_iterations=10),
+        )
+        assert diffs == []
+    def test_diff_behavior_same(self) -> None:
+        diffs = diff_behavior(foo1, foo2, DEFAULT_OPTIONS.overlay(max_iterations=10))
+        assert diffs == []
+    def test_diff_behavior_different(self) -> None:
+        diffs = diff_behavior(foo1, foo3, DEFAULT_OPTIONS.overlay(max_iterations=10))
+        assert len(diffs) == 1
+        diff = diffs[0]
+        assert isinstance(diff, BehaviorDiff)
+        assert int(diff.args["x"]) > 1000
+        assert diff.result1.return_repr == "100"
+        assert diff.result2.return_repr == "1000"
+    def test_diff_behavior_mutation(self) -> None:
+        def cut_out_item1(a: List[int], i: int):
+            a[i : i + 1] = []
+        def cut_out_item2(a: List[int], i: int):
+            a[:] = a[:i] + a[i + 1 :]
+        # TODO: this takes longer than I'd like:
+        opts = DEFAULT_OPTIONS.overlay(max_iterations=40)
+        diffs = diff_behavior(
+            FunctionInfo.from_fn(cut_out_item1),
+            FunctionInfo.from_fn(cut_out_item2),
+            opts,
+        )
+        assert not isinstance(diffs, str)
+        assert len(diffs) == 1
+        diff = diffs[0]
+        assert len(diff.args["a"]) > 1
+        assert diff.args["i"] == "-1"
+    def test_example_coverage(self) -> None:
+        # Try to get examples that highlist the differences in the code.
+        # Here, we add more conditions for the `return True` path and
+        # another case where we used to just `return False`.
+        def isack1(s: str) -> bool:
+            if s in ("y", "yes"):
+                return True
+            return False
+        def isack2(s: str) -> Optional[bool]:
+            if s in ("y", "yes", "Y", "YES"):
+                return True
+            if s in ("n", "no", "N", "NO"):
+                return False
+            return None
+        diffs = diff_behavior(
+            FunctionInfo.from_fn(isack1),
+            FunctionInfo.from_fn(isack2),
+            DEFAULT_OPTIONS.overlay(max_iterations=20),
+        )
+        debug("diffs=", diffs)
+        assert not isinstance(diffs, str)
+        return_vals = set((d.result1.return_repr, d.result2.return_repr) for d in diffs)
+        assert return_vals == {("False", "None"), ("False", "True")}
+def test_diff_behavior_lambda() -> None:
+    def f(a: Optional[Callable[[int], int]]):
+        if a:
+            return a(2) + 4
+        else:
+            return "hello"
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(f),
+        FunctionInfo.from_fn(f),
+        DEFAULT_OPTIONS,
+    )
+    assert diffs == []
+def test_diffbehavior_exceptions_default() -> None:
+    """
+    Default behavior of `diffbehavior` - treating exceptions as different.
+    """
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(_sum_list_original),
+        FunctionInfo.from_fn(_sum_list_rewrite),
+        DEFAULT_OPTIONS,
+    )
+    debug("diffs=", diffs)
+    assert len(diffs) == 1  # finds a counter-example
+    assert isinstance(diffs[0], BehaviorDiff)
+    assert diffs[0].result1
+    assert isinstance(diffs[0].result1.error, str)
+    assert isinstance(diffs[0].result2.error, str)
+    assert diffs[0].result1.error.startswith("TypeError")
+    assert diffs[0].result2.error.startswith("TypeError")
+    assert (
+        diffs[0].result1.error != diffs[0].result2.error
+    )  # Both code-blocks raise a different type error
+def test_diffbehavior_exceptions_same_type() -> None:
+    """
+    Treat exceptions of the same type as equivalent.
+    """
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(_sum_list_original),
+        FunctionInfo.from_fn(_sum_list_rewrite),
+        DEFAULT_OPTIONS,
+        exception_equivalence=ExceptionEquivalenceType.SAME_TYPE,
+    )
+    debug("diffs=", diffs)
+    assert len(diffs) == 0  # No-counter example, because all TypeErrors are equal
+def test_diffbehavior_exceptions_all() -> None:
+    """
+    Treat exceptions of all types as equivalent.
+    """
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(_sum_list_original),
+        FunctionInfo.from_fn(_sum_list_rewrite_2),
+        DEFAULT_OPTIONS,
+        exception_equivalence=ExceptionEquivalenceType.ALL,
+    )
+    debug("diffs=", diffs)
+    assert len(diffs) == 0  # No-counter example, because all TypeErrors are equal
+def test_diffbehavior_exceptions_same_type_different() -> None:
+    """
+    Find a counter-example when raising different exception types.
+    """
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(_sum_list_original),
+        FunctionInfo.from_fn(_sum_list_rewrite_2),
+        DEFAULT_OPTIONS,
+        exception_equivalence=ExceptionEquivalenceType.SAME_TYPE,
+    )
+    debug("diffs=", diffs)
+    assert (
+        len(diffs) == 1
+    )  # finds a counter-example, because TypeError!=CustomException
+    assert isinstance(diffs[0], BehaviorDiff)
+    assert isinstance(diffs[0].result1.error, str)
+    assert isinstance(diffs[0].result2.error, str)
+    assert diffs[0].result1.error.startswith("TypeError")
+    assert diffs[0].result2.error.startswith("CustomException")
+def test_diff_behavior_nan() -> None:
+    def f(x: float):
+        return x
+    diffs = diff_behavior(
+        FunctionInfo.from_fn(f),
+        FunctionInfo.from_fn(f),
+        DEFAULT_OPTIONS,
+    )
+    assert diffs == []