PyPI - dataforge-07 - Versions diffs - 0.1.0__py3-none-any.whl - Mend

dataforge-07 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (150) hide show

dataforge/__init__.py +204 -0
dataforge/__main__.py +5 -0
dataforge/agent/__init__.py +16 -0
dataforge/agent/providers.py +259 -0
dataforge/agent/scratchpad.py +183 -0
dataforge/agent/tool_actions.py +343 -0
dataforge/bench/__init__.py +31 -0
dataforge/bench/core.py +426 -0
dataforge/bench/groq_client.py +386 -0
dataforge/bench/methods.py +443 -0
dataforge/bench/report.py +309 -0
dataforge/bench/runner.py +247 -0
dataforge/causal/__init__.py +21 -0
dataforge/causal/dag.py +174 -0
dataforge/causal/pc.py +232 -0
dataforge/causal/root_cause.py +193 -0
dataforge/cli/__init__.py +50 -0
dataforge/cli/audit.py +70 -0
dataforge/cli/bench.py +154 -0
dataforge/cli/common.py +267 -0
dataforge/cli/constraints.py +407 -0
dataforge/cli/profile.py +147 -0
dataforge/cli/release.py +166 -0
dataforge/cli/repair.py +407 -0
dataforge/cli/revert.py +139 -0
dataforge/cli/watch.py +144 -0
dataforge/datasets/__init__.py +25 -0
dataforge/datasets/embedded/hospital/clean.csv +11 -0
dataforge/datasets/embedded/hospital/dirty.csv +11 -0
dataforge/datasets/real_world.py +290 -0
dataforge/datasets/registry.py +103 -0
dataforge/detectors/__init__.py +80 -0
dataforge/detectors/base.py +145 -0
dataforge/detectors/decimal_shift.py +166 -0
dataforge/detectors/fd_violation.py +157 -0
dataforge/detectors/type_mismatch.py +173 -0
dataforge/engine/__init__.py +39 -0
dataforge/engine/repair.py +905 -0
dataforge/env/__init__.py +22 -0
dataforge/env/environment.py +883 -0
dataforge/env/observation.py +61 -0
dataforge/env/openenv_core.py +161 -0
dataforge/env/reward.py +128 -0
dataforge/env/server.py +176 -0
dataforge/evaluation_contract.py +76 -0
dataforge/fixtures/hospital_10rows.csv +11 -0
dataforge/fixtures/hospital_schema.yaml +17 -0
dataforge/http/__init__.py +1 -0
dataforge/http/problem.py +103 -0
dataforge/integrations/__init__.py +1 -0
dataforge/integrations/dbt.py +164 -0
dataforge/observability.py +76 -0
dataforge/py.typed +1 -0
dataforge/release/__init__.py +1 -0
dataforge/release/doctor.py +367 -0
dataforge/release/full_vision.py +702 -0
dataforge/release/gate.py +861 -0
dataforge/release/playground_check.py +411 -0
dataforge/repair_contract.py +468 -0
dataforge/repairers/__init__.py +88 -0
dataforge/repairers/base.py +77 -0
dataforge/repairers/decimal_shift.py +43 -0
dataforge/repairers/fd_violation.py +225 -0
dataforge/repairers/type_mismatch.py +73 -0
dataforge/safety/__init__.py +5 -0
dataforge/safety/adversarial/attack_01_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_02_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_03_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_04_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_05_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_06_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_07_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_08_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_09_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_10_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_11_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_12_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_13_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_14_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_15_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_16_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_17_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_18_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_19_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_20_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_21_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_22_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_23_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_24_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_25_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_26_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_27_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_28_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_29_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_30_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_31_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_32_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_33_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_34_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_35_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_36_row_delete.yaml +11 -0
dataforge/safety/adversarial/attack_37_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_38_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_39_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_40_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_41_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_42_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_43_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_44_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_45_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_46_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_47_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_48_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_49_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_50_row_delete.yaml +7 -0
dataforge/safety/constitution.py +307 -0
dataforge/safety/constitutions/default.yaml +40 -0
dataforge/safety/filter.py +134 -0
dataforge/schema_inference.py +620 -0
dataforge/stores/__init__.py +46 -0
dataforge/stores/base.py +73 -0
dataforge/stores/cloud.py +78 -0
dataforge/stores/csv.py +94 -0
dataforge/stores/duckdb.py +313 -0
dataforge/stores/patch_plan.py +178 -0
dataforge/stores/registry.py +82 -0
dataforge/stores/repair.py +121 -0
dataforge/stores/revert.py +22 -0
dataforge/stores/sql.py +27 -0
dataforge/table.py +228 -0
dataforge/transactions/__init__.py +34 -0
dataforge/transactions/files.py +96 -0
dataforge/transactions/log.py +613 -0
dataforge/transactions/revert.py +102 -0
dataforge/transactions/txn.py +104 -0
dataforge/ui/__init__.py +1 -0
dataforge/ui/profile_view.py +136 -0
dataforge/ui/repair_diff.py +91 -0
dataforge/verifier/__init__.py +55 -0
dataforge/verifier/constraint_ir.py +155 -0
dataforge/verifier/explain.py +47 -0
dataforge/verifier/gate.py +5 -0
dataforge/verifier/schema.py +111 -0
dataforge/verifier/smt.py +433 -0
dataforge_07-0.1.0.dist-info/METADATA +436 -0
dataforge_07-0.1.0.dist-info/RECORD +150 -0
dataforge_07-0.1.0.dist-info/WHEEL +5 -0
dataforge_07-0.1.0.dist-info/entry_points.txt +3 -0
dataforge_07-0.1.0.dist-info/licenses/LICENSE +176 -0
dataforge_07-0.1.0.dist-info/top_level.txt +1 -0

dataforge/verifier/gate.py ADDED Viewed

@@ -0,0 +1,5 @@
+"""Compatibility exports for the Week 3 verifier."""
+from dataforge.verifier.smt import SMTVerifier, VerificationResult, VerificationVerdict
+__all__ = ["SMTVerifier", "VerificationResult", "VerificationVerdict"]

dataforge/verifier/schema.py ADDED Viewed

@@ -0,0 +1,111 @@
+"""Canonical schema models shared by detectors, safety, and the verifier."""
+from __future__ import annotations
+from typing import Literal
+from pydantic import ConfigDict, Field
+from pydantic.dataclasses import dataclass
+AggregateLiteral = Literal["sum", "avg"]
+_CONFIG = ConfigDict(frozen=True)
+@dataclass(config=_CONFIG, kw_only=True)
+class FunctionalDependency:
+    """Declared functional dependency: determinant columns -> dependent column."""
+    determinant: tuple[str, ...] = Field(min_length=1)
+    dependent: str = Field(min_length=1)
+@dataclass(config=_CONFIG, kw_only=True)
+class DomainBound:
+    """Numeric min/max bounds for a column."""
+    column: str = Field(min_length=1)
+    min_value: float | None = None
+    max_value: float | None = None
+    inclusive_min: bool = True
+    inclusive_max: bool = True
+@dataclass(config=_CONFIG, kw_only=True)
+class AcceptedValues:
+    """Closed set of allowed values for one column."""
+    column: str = Field(min_length=1)
+    values: tuple[str, ...] = Field(min_length=1)
+@dataclass(config=_CONFIG, kw_only=True)
+class RegexConstraint:
+    """Regex pattern a string column value must match."""
+    column: str = Field(min_length=1)
+    pattern: str = Field(min_length=1)
+@dataclass(config=_CONFIG, kw_only=True)
+class RelationshipConstraint:
+    """Single-column referential constraint against another relation."""
+    column: str = Field(min_length=1)
+    reference: str = Field(min_length=1)
+    reference_column: str = Field(min_length=1)
+@dataclass(config=_CONFIG, kw_only=True)
+class AggregateDependency:
+    """Metadata describing a source column used in an aggregate elsewhere."""
+    source_column: str = Field(min_length=1)
+    target_column: str = Field(min_length=1)
+    aggregate: AggregateLiteral
+    group_by: tuple[str, ...] = Field(default_factory=tuple)
+@dataclass(config=_CONFIG, kw_only=True)
+class Schema:
+    """Optional declared schema for a dataset."""
+    columns: dict[str, str] = Field(default_factory=dict)
+    functional_dependencies: tuple[FunctionalDependency, ...] = Field(default_factory=tuple)
+    pii_columns: frozenset[str] = Field(default_factory=frozenset)
+    primary_key_columns: frozenset[str] = Field(default_factory=frozenset)
+    not_null_columns: frozenset[str] = Field(default_factory=frozenset)
+    unique_columns: frozenset[str] = Field(default_factory=frozenset)
+    accepted_values: tuple[AcceptedValues, ...] = Field(default_factory=tuple)
+    regex_constraints: tuple[RegexConstraint, ...] = Field(default_factory=tuple)
+    relationships: tuple[RelationshipConstraint, ...] = Field(default_factory=tuple)
+    domain_bounds: tuple[DomainBound, ...] = Field(default_factory=tuple)
+    aggregate_dependencies: tuple[AggregateDependency, ...] = Field(default_factory=tuple)
+    def column_type(self, column: str) -> str | None:
+        """Return the declared type for a column, if any."""
+        return self.columns.get(column)
+    def domain_bounds_for(self, column: str) -> tuple[DomainBound, ...]:
+        """Return all domain bounds declared for the given column."""
+        return tuple(bound for bound in self.domain_bounds if bound.column == column)
+    def accepted_values_for(self, column: str) -> tuple[AcceptedValues, ...]:
+        """Return accepted-values constraints declared for the given column."""
+        return tuple(rule for rule in self.accepted_values if rule.column == column)
+    def regex_constraints_for(self, column: str) -> tuple[RegexConstraint, ...]:
+        """Return regex constraints declared for the given column."""
+        return tuple(rule for rule in self.regex_constraints if rule.column == column)
+    def relationships_for(self, column: str) -> tuple[RelationshipConstraint, ...]:
+        """Return relationship constraints declared for the given column."""
+        return tuple(rule for rule in self.relationships if rule.column == column)
+    def aggregate_dependencies_for(self, column: str) -> tuple[AggregateDependency, ...]:
+        """Return aggregate dependencies where the column is the source input."""
+        return tuple(
+            dependency
+            for dependency in self.aggregate_dependencies
+            if dependency.source_column == column
+        )

dataforge/verifier/smt.py ADDED Viewed

@@ -0,0 +1,433 @@
+"""Z3-backed candidate verifier for Week 3 repairs."""
+from __future__ import annotations
+import enum
+import re
+from collections.abc import Callable
+from dataclasses import dataclass
+from typing import Any
+from pydantic import BaseModel, Field
+from z3 import (  # type: ignore[import-untyped]
+    And,
+    Bool,
+    ForAll,
+    Function,
+    Implies,
+    Int,
+    IntSort,
+    IntVal,
+    Or,
+    RealSort,
+    RealVal,
+    Solver,
+    StringSort,
+    StringVal,
+    sat,
+    unknown,
+    unsat,
+)
+from dataforge.repairers.base import ProposedFix
+from dataforge.table import (
+    TableLike,
+    cell_value,
+    column_names,
+    copy_table,
+    row_count,
+    set_cell_value,
+)
+from dataforge.verifier.explain import explain_unsat_core
+from dataforge.verifier.schema import DomainBound, FunctionalDependency, Schema
+Z3ExprFactory = Callable[[Any], Any]
+Z3ValueFactory = Callable[[str], Any]
+class VerificationVerdict(enum.Enum):
+    """Possible outcomes of the verifier gate."""
+    ACCEPT = "accept"
+    REJECT = "reject"
+    UNKNOWN = "unknown"
+class VerificationResult(BaseModel):
+    """Typed result for the Week 3 verifier gate."""
+    verdict: VerificationVerdict
+    reason: str = Field(min_length=1)
+    unsat_core: tuple[str, ...] = Field(default_factory=tuple)
+    model_config = {"frozen": True}
+@dataclass(frozen=True)
+class _ColumnEncoding:
+    """Z3 encoding helpers for one column."""
+    name: str
+    column_type: str
+    function: Z3ExprFactory
+    value_factory: Z3ValueFactory
+class SchemaToSMT:
+    """Compile candidate-local constraints from a schema and working dataframe."""
+    def __init__(self, schema: Schema, df: TableLike, *, timeout_ms: int = 200) -> None:
+        self._schema = schema
+        self._df = df
+        self._timeout_ms = timeout_ms
+    def verify_fix(self, proposed_fix: ProposedFix) -> VerificationResult:
+        """Return whether a candidate fix satisfies schema constraints."""
+        if proposed_fix.fix.operation != "update":
+            return VerificationResult(
+                verdict=VerificationVerdict.REJECT,
+                reason="Only cell updates are supported by the verifier.",
+            )
+        row = proposed_fix.fix.row
+        column = proposed_fix.fix.column
+        if row < 0 or row >= row_count(self._df):
+            return VerificationResult(
+                verdict=VerificationVerdict.REJECT,
+                reason=f"Row {row} is out of bounds for the input file.",
+            )
+        if column not in column_names(self._df):
+            return VerificationResult(
+                verdict=VerificationVerdict.REJECT,
+                reason=f"Column '{column}' does not exist in the input file.",
+            )
+        relevant_columns = {column}
+        relevant_fds = tuple(
+            fd
+            for fd in self._schema.functional_dependencies
+            if column == fd.dependent or column in fd.determinant
+        )
+        for fd in relevant_fds:
+            relevant_columns.update(fd.determinant)
+            relevant_columns.add(fd.dependent)
+        try:
+            encodings = {
+                name: self._build_column_encoding(name) for name in sorted(relevant_columns)
+            }
+        except ValueError as exc:
+            return VerificationResult(
+                verdict=VerificationVerdict.UNKNOWN,
+                reason=str(exc),
+            )
+        solver = Solver()
+        solver.set(timeout=self._timeout_ms, unsat_core=True)
+        try:
+            self._add_value_assignments(solver, encodings, proposed_fix)
+        except ValueError as exc:
+            return VerificationResult(
+                verdict=VerificationVerdict.UNKNOWN,
+                reason=str(exc),
+            )
+        for column_name in sorted(
+            schema_column
+            for schema_column in (
+                set(self._schema.not_null_columns)
+                | set(self._schema.primary_key_columns)
+                | set(self._schema.unique_columns)
+                | {rule.column for rule in self._schema.accepted_values}
+                | {rule.column for rule in self._schema.regex_constraints}
+            )
+            if schema_column == column
+        ):
+            if column_name in self._schema.not_null_columns:
+                self._track_not_null(solver, encodings[column_name], proposed_fix)
+            if column_name in self._schema.primary_key_columns:
+                self._track_not_null(
+                    solver,
+                    encodings[column_name],
+                    proposed_fix,
+                    label_prefix="primary_key_not_null",
+                )
+                self._track_unique(
+                    solver,
+                    encodings[column_name],
+                    proposed_fix,
+                    label_prefix="primary_key_unique",
+                )
+            if column_name in self._schema.unique_columns:
+                self._track_unique(solver, encodings[column_name], proposed_fix)
+            for rule in self._schema.accepted_values_for(column_name):
+                try:
+                    self._track_accepted_values(
+                        solver,
+                        encodings[column_name],
+                        proposed_fix,
+                        rule.values,
+                    )
+                except ValueError as exc:
+                    return VerificationResult(
+                        verdict=VerificationVerdict.UNKNOWN,
+                        reason=str(exc),
+                    )
+            regex_result = self._check_regex_constraints(column_name, proposed_fix)
+            if regex_result is not None:
+                return regex_result
+        for bound in self._schema.domain_bounds_for(column):
+            self._track_domain_bound(solver, encodings[column], proposed_fix, bound)
+        for fd in relevant_fds:
+            self._track_fd_constraint(solver, encodings, proposed_fix, fd)
+        result = solver.check()
+        if result == sat:
+            return VerificationResult(
+                verdict=VerificationVerdict.ACCEPT,
+                reason="The candidate fix satisfied all tracked verifier constraints.",
+            )
+        if result == unsat:
+            unsat_core = tuple(str(label) for label in solver.unsat_core())
+            return VerificationResult(
+                verdict=VerificationVerdict.REJECT,
+                reason=explain_unsat_core(unsat_core, self._schema),
+                unsat_core=unsat_core,
+            )
+        if result == unknown:
+            return VerificationResult(
+                verdict=VerificationVerdict.UNKNOWN,
+                reason=f"Solver returned unknown: {solver.reason_unknown()}",
+            )
+        return VerificationResult(
+            verdict=VerificationVerdict.UNKNOWN,
+            reason="Solver returned an unrecognized status.",
+        )
+    def _build_column_encoding(self, column: str) -> _ColumnEncoding:
+        column_type = (self._schema.column_type(column) or "str").strip().lower()
+        function_name = f"col_{column.replace(' ', '_')}"
+        if column_type in {"int", "integer"}:
+            return _ColumnEncoding(
+                name=column,
+                column_type=column_type,
+                function=Function(function_name, IntSort(), IntSort()),
+                value_factory=lambda raw: IntVal(int(raw)),
+            )
+        if column_type in {"float", "decimal", "real"}:
+            return _ColumnEncoding(
+                name=column,
+                column_type=column_type,
+                function=Function(function_name, IntSort(), RealSort()),
+                value_factory=lambda raw: RealVal(str(float(raw))),
+            )
+        if column_type in {"str", "string"}:
+            return _ColumnEncoding(
+                name=column,
+                column_type=column_type,
+                function=Function(function_name, IntSort(), StringSort()),
+                value_factory=lambda raw: StringVal(str(raw)),
+            )
+        raise ValueError(f"Unsupported schema type '{column_type}' for column '{column}'.")
+    def _add_value_assignments(
+        self,
+        solver: Solver,
+        encodings: dict[str, _ColumnEncoding],
+        proposed_fix: ProposedFix,
+    ) -> None:
+        for column, encoding in encodings.items():
+            for index in range(row_count(self._df)):
+                raw_value = cell_value(self._df, index, column)
+                if index == proposed_fix.fix.row and column == proposed_fix.fix.column:
+                    raw_value = proposed_fix.fix.new_value
+                try:
+                    z3_value = encoding.value_factory(raw_value)
+                except (TypeError, ValueError) as exc:
+                    raise ValueError(
+                        f"Could not encode value '{raw_value}' for column '{column}' "
+                        f"as type '{encoding.column_type}'."
+                    ) from exc
+                solver.add(encoding.function(IntVal(index)) == z3_value)
+    def _track_domain_bound(
+        self,
+        solver: Solver,
+        encoding: _ColumnEncoding,
+        proposed_fix: ProposedFix,
+        bound: DomainBound,
+    ) -> None:
+        row_expr = encoding.function(IntVal(proposed_fix.fix.row))
+        if bound.min_value is not None:
+            label = Bool(f"domain::{bound.column}::min::row::{proposed_fix.fix.row}")
+            threshold = (
+                RealVal(str(bound.min_value))
+                if encoding.column_type != "int"
+                else IntVal(int(bound.min_value))
+            )
+            formula = row_expr >= threshold if bound.inclusive_min else row_expr > threshold
+            solver.assert_and_track(formula, label)
+        if bound.max_value is not None:
+            label = Bool(f"domain::{bound.column}::max::row::{proposed_fix.fix.row}")
+            threshold = (
+                RealVal(str(bound.max_value))
+                if encoding.column_type != "int"
+                else IntVal(int(bound.max_value))
+            )
+            formula = row_expr <= threshold if bound.inclusive_max else row_expr < threshold
+            solver.assert_and_track(formula, label)
+    def _track_not_null(
+        self,
+        solver: Solver,
+        encoding: _ColumnEncoding,
+        proposed_fix: ProposedFix,
+        *,
+        label_prefix: str = "not_null",
+    ) -> None:
+        """Track a non-empty value constraint for the candidate cell."""
+        if encoding.column_type not in {"str", "string"}:
+            return
+        label = Bool(f"{label_prefix}::{encoding.name}::row::{proposed_fix.fix.row}")
+        row_expr = encoding.function(IntVal(proposed_fix.fix.row))
+        empty_value = encoding.value_factory("")
+        solver.assert_and_track(row_expr != empty_value, label)
+    def _track_unique(
+        self,
+        solver: Solver,
+        encoding: _ColumnEncoding,
+        proposed_fix: ProposedFix,
+        *,
+        label_prefix: str = "unique",
+    ) -> None:
+        """Track that the candidate value is unique across all other rows."""
+        other_rows = [
+            encoding.function(IntVal(index)) != encoding.function(IntVal(proposed_fix.fix.row))
+            for index in range(row_count(self._df))
+            if index != proposed_fix.fix.row
+        ]
+        if not other_rows:
+            return
+        label = Bool(f"{label_prefix}::{encoding.name}::row::{proposed_fix.fix.row}")
+        solver.assert_and_track(And(*other_rows), label)
+    def _track_accepted_values(
+        self,
+        solver: Solver,
+        encoding: _ColumnEncoding,
+        proposed_fix: ProposedFix,
+        values: tuple[str, ...],
+    ) -> None:
+        """Track that the candidate value belongs to a closed allowed set."""
+        if not values:
+            return
+        row_expr = encoding.function(IntVal(proposed_fix.fix.row))
+        try:
+            allowed = [row_expr == encoding.value_factory(value) for value in values]
+        except (TypeError, ValueError) as exc:
+            raise ValueError(
+                f"Could not encode accepted values for column '{encoding.name}' "
+                f"as type '{encoding.column_type}'."
+            ) from exc
+        label = Bool(f"accepted_values::{encoding.name}::row::{proposed_fix.fix.row}")
+        solver.assert_and_track(Or(*allowed), label)
+    def _check_regex_constraints(
+        self,
+        column: str,
+        proposed_fix: ProposedFix,
+    ) -> VerificationResult | None:
+        """Conservatively evaluate declared regex constraints before solver check."""
+        if column != proposed_fix.fix.column:
+            return None
+        for rule in self._schema.regex_constraints_for(column):
+            try:
+                matches = re.fullmatch(rule.pattern, proposed_fix.fix.new_value) is not None
+            except re.error as exc:
+                return VerificationResult(
+                    verdict=VerificationVerdict.UNKNOWN,
+                    reason=f"Invalid regex constraint for column '{column}': {exc}",
+                )
+            if not matches:
+                label = f"regex::{column}::row::{proposed_fix.fix.row}"
+                return VerificationResult(
+                    verdict=VerificationVerdict.REJECT,
+                    reason=explain_unsat_core((label,), self._schema),
+                    unsat_core=(label,),
+                )
+        return None
+    def _track_fd_constraint(
+        self,
+        solver: Solver,
+        encodings: dict[str, _ColumnEncoding],
+        proposed_fix: ProposedFix,
+        fd: FunctionalDependency,
+    ) -> None:
+        # Use a universally-quantified implication over all valid other rows.
+        other_row = Int("other_row")
+        bounds_guard = And(other_row >= 0, other_row < row_count(self._df))
+        candidate_row = IntVal(proposed_fix.fix.row)
+        determinant_equal = And(
+            *[
+                encodings[column].function(candidate_row) == encodings[column].function(other_row)
+                for column in fd.determinant
+            ]
+        )
+        dependent_equal = encodings[fd.dependent].function(candidate_row) == encodings[
+            fd.dependent
+        ].function(other_row)
+        determinant_label = "+".join(fd.determinant)
+        label = Bool(f"fd::{determinant_label}::{fd.dependent}::row::{proposed_fix.fix.row}")
+        solver.assert_and_track(
+            ForAll([other_row], Implies(bounds_guard, Implies(determinant_equal, dependent_equal))),
+            label,
+        )
+class SMTVerifier:
+    """Compatibility wrapper over the Week 3 `SchemaToSMT` verifier."""
+    def verify(
+        self,
+        df: TableLike,
+        fixes: list[ProposedFix],
+        schema: Schema | None = None,
+    ) -> VerificationResult:
+        """Verify one or more candidate fixes against the working dataframe."""
+        if schema is None:
+            total_rows = row_count(df)
+            for proposed in fixes:
+                if proposed.fix.row < 0 or proposed.fix.row >= total_rows:
+                    return VerificationResult(
+                        verdict=VerificationVerdict.REJECT,
+                        reason=f"Row {proposed.fix.row} is out of bounds for the input file.",
+                    )
+                if proposed.fix.column not in column_names(df):
+                    return VerificationResult(
+                        verdict=VerificationVerdict.REJECT,
+                        reason=f"Column '{proposed.fix.column}' does not exist in the input file.",
+                    )
+            return VerificationResult(
+                verdict=VerificationVerdict.ACCEPT,
+                reason="All proposed fixes passed structural verification.",
+            )
+        working_df = copy_table(df)
+        verifier = SchemaToSMT(schema, working_df)
+        for proposed in fixes:
+            result = verifier.verify_fix(proposed)
+            if result.verdict != VerificationVerdict.ACCEPT:
+                return result
+            set_cell_value(
+                working_df, proposed.fix.row, proposed.fix.column, proposed.fix.new_value
+            )
+            verifier = SchemaToSMT(schema, working_df)
+        return VerificationResult(
+            verdict=VerificationVerdict.ACCEPT,
+            reason="All proposed fixes passed the SMT verifier.",
+        )