PyPI - off - Versions diffs - 0.1.0__py3-none-any.whl - Mend

off 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

off/__init__.py +23 -0
off/atom_energies.py +151 -0
off/config/_config.py +108 -0
off/dft_distrax/__init__.py +27 -0
off/dft_distrax/dft_distrax.py +216 -0
off/flow/__init__.py +29 -0
off/flow/equiv_flows.py +99 -0
off/functionals/__init__.py +35 -0
off/functionals/core_correction.py +84 -0
off/functionals/exchange_correlation.py +174 -0
off/functionals/external.py +49 -0
off/functionals/functional.py +129 -0
off/functionals/hartree.py +62 -0
off/functionals/kinetic.py +87 -0
off/main.py +172 -0
off/ode_solver/__init__.py +32 -0
off/ode_solver/eqx_ode.py +76 -0
off/plot_binding_csv.py +63 -0
off/plot_pes_ema.py +259 -0
off/plot_pes_mpl.py +280 -0
off/promolecular/__init__.py +27 -0
off/promolecular/promolecular_dist.py +465 -0
off/quadrature.py +261 -0
off/quadrature_scan.py +188 -0
off/scan_pes.py +133 -0
off/test_fwd_rev.py +290 -0
off/train/__init__.py +44 -0
off/train/loop.py +228 -0
off/train/loss.py +149 -0
off/train/utils.py +38 -0
off/utils.py +618 -0
off-0.1.0.dist-info/METADATA +154 -0
off-0.1.0.dist-info/RECORD +37 -0
off-0.1.0.dist-info/WHEEL +5 -0
off-0.1.0.dist-info/entry_points.txt +3 -0
off-0.1.0.dist-info/licenses/LICENSE +21 -0
off-0.1.0.dist-info/top_level.txt +1 -0

off/main.py ADDED Viewed

@@ -0,0 +1,172 @@
+import argparse
+import json
+from fractions import Fraction
+from pathlib import Path
+from .train.loop import training
+from .config._config import Config
+def _lam(value: str) -> float:
+    """Accept λ as a fraction ('1/9', '1/5') or plain float ('0.2', '2.0')."""
+    try:
+        return float(Fraction(value))
+    except (ValueError, ZeroDivisionError):
+        raise argparse.ArgumentTypeError(
+            f"Invalid λ value '{value}'. Use a fraction (1/9, 1/5) or float (0.111, 2.0)."
+        )
+SINGLE_ATOMS = {'H', 'He', 'Li', 'Be', 'B', 'C', 'N', 'O', 'F', 'Ne'}
+def _method_tag(args) -> str:
+    """Encode functional/solver choices into a compact directory name."""
+    kin_tag = args.kin
+    if args.kin in ('w', 'tf_w'):
+        kin_tag += f"_lam{args.lam:.6g}"
+    tag = f"{kin_tag}_{args.cc}_{args.x}_{args.c}_{args.solver}_{args.prior}"
+    if args.sched.lower() not in ['c', 'const']:
+        tag += f"_sched_{args.sched}"
+    if args.hart.lower() != 'coulomb':
+        tag += f"_hart_{args.hart}"
+    return tag.lower()
+def setup_directories(args):
+    """Create and return directory paths for results, checkpoints, and figures.
+    Layout:  Results/{mol}/{method}/bl_{bond_length}/
+      - Single atoms always use bl_0.0000 (bond length has no meaning).
+      - Diatomics/polyatomics use the supplied --bond_length value.
+    This makes bond-length scans trivial:
+      glob('Results/H2/{method}/bl_*/')
+    """
+    bl = 0.0 if args.mol_name in SINGLE_ATOMS else args.bond_length
+    results_dir = f"Results/{args.mol_name}/{_method_tag(args)}/bl_{bl:.2f}"
+    ckpt_dir    = f"{results_dir}/Checkpoints"
+    for directory in [results_dir, ckpt_dir]:
+        Path(directory).mkdir(parents=True, exist_ok=True)
+    return results_dir, ckpt_dir
+def save_job_params(results_dir, args):
+    """Save training parameters to JSON file."""
+    job_params = {
+        'model': 'cnf',
+        'mol_name': args.mol_name,
+        'bond_length': args.bond_length,
+        'epochs': args.epochs,
+        'batch_size': args.bs,
+        'hidden_layer': args.hl,
+        'lr': args.lr,
+        'kinetic': args.kin,
+        'lam': args.lam,
+        'external': args.nuc,
+        'hartree': args.hart,
+        'exchange': args.x,
+        'correlation': args.c,
+        'core_correction': args.cc,
+        'scheduler': args.sched,
+        'solver': args.solver,
+        'prior': args.prior,
+    }
+    with open(f"{results_dir}/job_params.json", "w") as outfile:
+        json.dump(job_params, outfile, indent=4)
+    return job_params
+def main():
+    parser = argparse.ArgumentParser()
+    # Model parameters
+    parser.add_argument("--mol_name", type=str, default='H',
+                        help="Molecule name")
+    parser.add_argument("--bond_length", type=float, default=4.4,
+                        help="Bond length for the molecule (Bohr)")
+    parser.add_argument("--epochs", type=int, default=500,
+                        help="Number of training epochs")
+    parser.add_argument("--bs", type=int, default=512,
+                        help="Batch size")
+    parser.add_argument("--hl", type=int, default=64,
+                        help="Hidden layer size")
+    parser.add_argument("--lr", type=float, default=3e-4,
+                        help="Learning rate")
+    parser.add_argument("--prior", type=str, default='promolecular',
+                    choices=['promolecular', 'db_sir'],
+                    help="Prior distribution type")
+    # Functionals
+    parser.add_argument("--kin", type=str, default='tf_w',
+                        choices=['tf', 'w', 'tf_w'],
+                        help="Kinetic energy functional")
+    parser.add_argument("--lam", type=_lam, default=1/5,
+                        help="Weizsäcker prefactor λ in TF-λW: fraction or float ")
+    parser.add_argument("--nuc", type=str, default='np',
+                        help="Nuclear potential functional")
+    parser.add_argument("--hart", type=str, default='coulomb',
+                        help="Hartree energy functional")
+    parser.add_argument("--x", type=str, default='lda',
+                        choices=['lda', 'b88_x', 'lda_b88_x'],
+                        help="Exchange energy functional")
+    parser.add_argument("--c", type=str, default='none',
+                        choices=['vwn_c', 'pw92_c', 'none'],
+                        help="Correlation energy functional")
+    parser.add_argument("--cc", type=str, default='none',
+                        choices=['kato', 'hutcheon', 'none'],
+                        help="Core correction functional")
+    # Training settings
+    parser.add_argument("--sched", type=str, default='mix',
+                        help="Learning rate scheduler type")
+    parser.add_argument("--solver", type=str, default='dopri8',
+                        choices=['dopri5', 'tsit5', 'dopri8'],
+                        help="ODE solver")
+    parser.add_argument("--ckpt_freq", type=int, default=15,
+                        help="Checkpoint saving frequency (epochs)")
+    args = parser.parse_args()
+    Config.from_args(args)
+    # Setup directories
+    results_dir, ckpt_dir = setup_directories(args)
+    Config.set_directories(results_dir, ckpt_dir)
+    # Save parameters
+    job_params = save_job_params(results_dir, args)
+    print(f"Starting training with parameters:")
+    print(json.dumps(job_params, indent=2))
+    print(f"\nResults will be saved to: {results_dir}")
+    # Run training
+    shared = dict(
+        mol_name=args.mol_name,
+        bond_length=args.bond_length,
+        tw_kin=args.kin,
+        lam=args.lam,
+        n_pot=args.nuc,
+        h_pot=args.hart,
+        x_pot=args.x,
+        c_pot=args.c,
+        cc_pot=args.cc,
+        batch_size=args.bs,
+        hidden_layer=args.hl,
+        epochs=args.epochs,
+        lr=args.lr,
+        scheduler_type=args.sched,
+        prior_type=args.prior,
+        checkpoint_dir=ckpt_dir,
+        checkpoint_freq=args.ckpt_freq,
+    )
+    model, df, df_ema = training(**shared, solver_type=args.solver)
+    print(f"\nTraining complete!")
+    print(f"Results saved to: {results_dir}")
+    print(f"Final energy (EMA): {df_ema['E'].iloc[-1]:.6f}")
+if __name__ == "__main__":
+    main()

off/ode_solver/__init__.py ADDED Viewed

@@ -0,0 +1,32 @@
+# MIT License
+# Copyright (c) 2025 AlexandreDeCamargo
+# Permission is hereby granted, free of charge, to any person obtaining a copy
+# of this software and associated documentation files (the "Software"), to deal
+# in the Software without restriction, including without limitation the rights
+# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+# copies of the Software, and to permit persons to whom the Software is
+# furnished to do so, subject to the following conditions:
+# The above copyright notice and this permission notice shall be included in all
+# copies or substantial portions of the Software.
+# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+# SOFTWARE.
+__version__ = "0.1.0"
+from .eqx_ode import (
+    fwd_ode,
+    rev_ode,
+)
+from ..flow.equiv_flows import (
+    CNF,
+)

off/ode_solver/eqx_ode.py ADDED Viewed

@@ -0,0 +1,76 @@
+from diffrax import diffeqsolve, ODETerm, SaveAt, PIDController
+import jax
+import jax.numpy as jnp
+import functools
+@functools.partial(jax.vmap, in_axes=(None,0,0), out_axes=0)
+def forward(model,x,t):
+    return model(x,t)
+def fwd_ode(flow_model,x_and_logpx,solver):
+    t0 = 0.
+    t1 = 1.
+    dt0 = t1 - t0
+    vector_field = lambda t,x,args: forward(flow_model,x,t*jnp.ones((x.shape[0],1)))
+    term = ODETerm(vector_field)
+    solver = solver
+    saveat = SaveAt(ts=jnp.array([0.,1.]))
+    #Set a dict to change the rtol and atol
+    stepsize_controller=PIDController(rtol=1e-8, atol=1e-8)
+    sol = diffeqsolve(term, solver, t0, t1, dt0, x_and_logpx,
+                    stepsize_controller=stepsize_controller,
+                    saveat=saveat)
+    data_dim = 3
+    z_t, logp_diff_t, score_t = sol.ys[:, :,:data_dim],sol.ys[:, :, data_dim:data_dim+1],sol.ys[:, :, data_dim+1:]
+    z_t1, logp_diff_t1, score_t1 = z_t[-1], logp_diff_t[-1], score_t[-1]
+    return z_t1, logp_diff_t1, score_t1
+# def rev_ode(flow_model, z_and_logpz, solver):
+#     t0 = 0.
+#     t1 = 1.
+#     dt0 = t1 - t0
+#     vector_field = lambda t,x,args: forward(flow_model,x,t*jnp.ones((x.shape[0],1)))
+#     term = ODETerm(vector_field)
+#     solver = solver
+#     saveat = SaveAt(ts=jnp.array([1., 0.]))
+#     stepsize_controller = PIDController(rtol=1e-8, atol=1e-8)
+#     sol = diffeqsolve(term, solver, t1, t0, -dt0, z_and_logpz,
+#                      stepsize_controller=stepsize_controller,
+#                      saveat=saveat)
+#     data_dim = 3
+#     z_t, logp_diff_t, score_diff_t = sol.ys[:, :, :data_dim], sol.ys[:, :, data_dim:data_dim+1], sol.ys[:, :, data_dim+1:]
+#     z_t0, logp_diff_t0, score_diff_t0 = z_t[-1], logp_diff_t[-1], score_diff_t[-1]
+#     return z_t0, logp_diff_t0, score_diff_t0
+def rev_ode(flow_model, z_and_logpz, solver):
+    t0 = 0.
+    t1 = 1.
+    dt0 = t1 - t0
+    vector_field = lambda t,x,args: forward(flow_model,x,t*jnp.ones((x.shape[0],1)))
+    term = ODETerm(vector_field)
+    solver = solver
+    saveat = SaveAt(ts=jnp.array([1., 0.]))
+    stepsize_controller = PIDController(rtol=1e-8, atol=1e-8)
+    sol = diffeqsolve(term, solver, t1, t0, -dt0, z_and_logpz,
+                     stepsize_controller=stepsize_controller,
+                     saveat=saveat)
+    data_dim = 3
+    # z_t, logp_diff_t, _ = sol.ys[:-1, :, :data_dim], sol.ys[:-1, :, data_dim:data_dim+1], sol.ys[:, :, data_dim+1:]
+    # z_t0, logp_diff_t0 = sol.ys[:-1, :, :data_dim], sol.ys[:-1, :, data_dim:data_dim+1]
+    # return sol.ys
+    z_t, logp_diff_t, score_diff_t = sol.ys[:, :, :data_dim], sol.ys[:, :, data_dim:data_dim+1], sol.ys[:, :, data_dim+1:]
+    z_t0, logp_diff_t0, score_diff_t0 = z_t[-1], logp_diff_t[-1], score_diff_t[-1]
+    return z_t0, logp_diff_t0

off/plot_binding_csv.py ADDED Viewed

@@ -0,0 +1,63 @@
+"""
+Plot a binding_{mol}.csv:  PES (left) and ΔE binding (right).
+  MC   = blue line + markers
+  grid = orange dots
+Usage:
+    python plot_binding_csv.py Results/N2/binding_N2.csv
+    python plot_binding_csv.py Results/N2/binding_N2.csv --out n2.png
+"""
+import argparse
+from pathlib import Path
+import pandas as pd
+import matplotlib
+matplotlib.use("Agg")
+import matplotlib.pyplot as plt
+ap = argparse.ArgumentParser()
+ap.add_argument("csv", help="path to binding_{mol}.csv")
+ap.add_argument("--out", default=None, help="output image (default: <csv>.png)")
+args = ap.parse_args()
+df = pd.read_csv(args.csv)
+fig, (axL, axR) = plt.subplots(1, 2, figsize=(14, 6))
+for method, g in df.groupby("method"):
+    g = g.sort_values("R_bohr")
+    # ── left: total energy (PES) ──────────────────────────────────────────────
+    axL.plot(g.R_bohr, g.E_AB_mc, "-o", color="tab:blue", lw=2, ms=7, label="MC")
+    axL.scatter(g.R_bohr, g.E_AB_grid, color="orange", marker="o", s=70,
+                edgecolors="black", linewidths=0.5, zorder=5, label="grid")
+    if "E_atoms_grid" in g.columns:                       # dissociation limit (grid)
+        axL.axhline(g.E_atoms_grid.iloc[0], color="orange", ls=":", lw=1.2,
+                    alpha=0.9, label=r"2·E(atom) grid")
+    # ── right: ΔE = E(A) + E(B) - E(AB) ───────────────────────────────────────
+    axR.plot(g.R_bohr, g.dE_mc_Ha, "-o", color="tab:blue", lw=2, ms=7, label="MC")
+    axR.scatter(g.R_bohr, g.dE_grid_Ha, color="orange", marker="o", s=70,
+                edgecolors="black", linewidths=0.5, zorder=5, label="grid")
+axL.set_xlabel("R [Bohr]")
+axL.set_ylabel(r"E[$\rho$] + V$_{NN}$(R) [a.u.]")
+axL.set_title("PES")
+axL.grid(alpha=0.3)
+axL.legend(fontsize=8)
+axR.axhline(0, color="k", lw=0.8, ls="--")
+axR.set_xlabel("R [Bohr]")
+axR.set_ylabel(r"$\Delta$E = E(A) + E(B) - E(AB) [a.u.]")
+axR.set_title("Binding energy")
+axR.grid(alpha=0.3)
+axR.legend(fontsize=8)
+fig.suptitle(Path(args.csv).stem)
+fig.tight_layout()
+out = Path(args.out) if args.out else Path(args.csv).with_suffix(".png")
+fig.savefig(out, dpi=150)
+fig.savefig(out.with_suffix(".svg"))
+print("saved →", out)
+print("saved →", out.with_suffix(".svg"))

off/plot_pes_ema.py ADDED Viewed

@@ -0,0 +1,259 @@
+"""
+Quick PES plot from EMA training logs — no grid integration needed.
+Reads training_metrics_ema.csv from each bl_* directory and uses the
+last epoch's EMA energy (E + CC) as E_total.
+Usage
+-----
+# PES only:
+python plot_pes_ema.py \
+    --scan_dir Results/H2/tf_w_lam0.2_hutcheon_lda_none_dopri8_promolecular_sched_MIX
+# With binding energy (needs H atom dir):
+python plot_pes_ema.py \
+    --scan_dir Results/N2/tf_w_lam0.2_none_lda_none_dopri8_promolecular_sched_MIX_hart_COULOMB_ALLPAIRS \
+    --atom_dir Results/N/tf_w_lam0.2_none_lda_none_dopri8_promolecular_sched_MIX_hart_COULOMB_ALLPAIRS/bl_0.0000
+# Read R=8.0 and R=9.0 at epoch 20000, the rest at their last epoch:
+python plot_pes_ema.py --scan_dir Results/N2/... --epoch_at 8.0:20000 9.0:20000
+"""
+import argparse
+from pathlib import Path
+import matplotlib.pyplot as plt
+import numpy as np
+import pandas as pd
+parser = argparse.ArgumentParser()
+parser.add_argument("--scan_dir", type=str, required=True,
+                    help="Method directory containing bl_X.XXXX subdirectories")
+parser.add_argument("--atom_dir", type=str, default=None,
+                    help="bl_0.0000 directory for the H atom (binding energy reference)")
+parser.add_argument("--pes_csv", type=str, default=None,
+                    help="pes.csv from scan_pes.py to overlay as grid-integration "
+                         "points. If omitted, looks for pes.csv inside --scan_dir.")
+parser.add_argument("--avg_window", type=int, default=1,
+                    help="Average the last N rows of training_metrics_ema.csv "
+                         "instead of taking just the last value (default: 500).")
+parser.add_argument("--bls", type=float, nargs="+", default=None,
+                    help="Only include these bond lengths, e.g. --bls 2.0 3.0 4.0 9.0. "
+                         "If omitted, include all bl_* directories found.")
+parser.add_argument("--epoch_at", type=str, nargs="+", default=None, metavar="R:EPOCH",
+                    help="Per-bond-length epoch override, e.g. --epoch_at 8.0:20000 9.0:20000. "
+                         "Those bond lengths use the EMA as of that epoch; all others use "
+                         "their last epoch.")
+args = parser.parse_args()
+scan_dir = Path(args.scan_dir).resolve()
+# Parse --epoch_at "R:EPOCH" pairs into {round(R,4): epoch}
+EPOCH_OVERRIDE = {}
+if args.epoch_at:
+    for pair in args.epoch_at:
+        if ":" not in pair:
+            parser.error(f"--epoch_at expects R:EPOCH pairs, got '{pair}'")
+        r_str, e_str = pair.split(":", 1)
+        EPOCH_OVERRIDE[round(float(r_str), 4)] = int(e_str)
+    print(f"Epoch overrides: {EPOCH_OVERRIDE}")
+def read_last_ema(bl_dir: Path, window: int = 500, at_epoch: int = None):
+    """Return (E_electronic, epoch) averaged over the last `window` rows of
+    training_metrics_ema.csv.  Epoch returned is the final one (window is just
+    smoothing the EMA noise).
+    E_electronic = E + CC  (does NOT include nuclear repulsion E_NN).
+    If `at_epoch` is given, the log is first truncated to rows with
+    epoch <= at_epoch, so the value is read *as of* that epoch.
+    """
+    csv = bl_dir / "training_metrics_ema.csv"
+    if not csv.exists():
+        return None, None
+    df = pd.read_csv(csv)
+    if df.empty:
+        return None, None
+    if at_epoch is not None:
+        df = df[df["epoch"] <= at_epoch]      # read the EMA as of this epoch
+        if df.empty:
+            return None, None
+    tail = df.tail(window)
+    E_elec = float(tail["E"].mean())
+    if "CC" in tail.columns:
+        E_elec += float(tail["CC"].mean())
+    epoch = int(df.iloc[-1]["epoch"])
+    return E_elec, epoch
+def e_nn(mol_name: str, R: float) -> float:
+    """Nuclear-nuclear repulsion energy [Ha] for a diatomic at bond length R [Bohr]."""
+    Z = {"H": 1, "He": 2, "Li": 3, "Be": 4, "B": 5, "C": 6,
+         "N": 7, "O": 8, "F": 9, "Ne": 10}
+    # homonuclear diatomics: mol_name = element symbol × 2 (e.g. "H2", "N2")
+    elem = mol_name.rstrip("0123456789")
+    if mol_name in ("HF",):
+        za, zb = Z["H"], Z["F"]
+    elif mol_name == "CO":
+        za, zb = Z["C"], Z["O"]
+    elif mol_name == "NO":
+        za, zb = Z["N"], Z["O"]
+    else:
+        za = zb = Z.get(elem, 1)
+    return za * zb / R if R > 0 else 0.0
+# ── H atom reference ──────────────────────────────────────────────────────────
+E_atom = None
+if args.atom_dir is not None:
+    E_atom, ep_atom = read_last_ema(Path(args.atom_dir).resolve(), window=args.avg_window)
+    if E_atom is not None:
+        print(f"E(atom) = {E_atom:+.6f} Ha  (epoch {ep_atom})")
+    else:
+        print(f"WARNING: could not read atom EMA from {args.atom_dir}")
+        E_atom = None
+# ── Scan over bl_* directories ────────────────────────────────────────────────
+bl_dirs = sorted(scan_dir.glob("bl_*"),
+                 key=lambda d: float(d.name.split("_")[1]))
+if not bl_dirs:
+    raise FileNotFoundError(f"No bl_* directories found in {scan_dir}")
+if args.bls is not None:
+    keep = {round(bl, 4) for bl in args.bls}
+    bl_dirs = [d for d in bl_dirs if round(float(d.name.split("_")[1]), 4) in keep]
+    if not bl_dirs:
+        raise FileNotFoundError(
+            f"None of --bls {args.bls} match any bl_X.XXXX in {scan_dir}")
+    print(f"Filtered to {len(bl_dirs)} requested bond lengths: "
+          f"{[d.name for d in bl_dirs]}")
+import json, re
+# detect molecule name from first bl_* job_params.json
+mol_name = "H2"
+for d in bl_dirs:
+    jp = d / "job_params.json"
+    if jp.exists():
+        mol_name = json.load(open(jp))["mol_name"]
+        break
+print(f"Molecule: {mol_name}")
+# Parse mol_name for LaTeX labels: A_n -> atom_sym='A', mol_latex='\mathrm{A}_n'
+_m = re.fullmatch(r"([A-Z][a-z]?)(\d+)?", mol_name)
+if _m and _m.group(2):
+    atom_sym = _m.group(1)
+    mol_latex = rf"\mathrm{{{atom_sym}}}_{{{_m.group(2)}}}"
+else:
+    atom_sym  = mol_name
+    mol_latex = rf"\mathrm{{{mol_name}}}"
+    if mol_name in ("HF", "CO", "NO"):
+        print(f"WARNING: {mol_name} is heteronuclear — binding uses 2*E_atom, "
+              f"which assumes homonuclear dissociation and will be physically wrong")
+rows = []
+for bl_dir in bl_dirs:
+    R = float(bl_dir.name.split("_")[1])
+    if R == 0.0:
+        continue                      # skip atom directory if present
+    at = EPOCH_OVERRIDE.get(round(R, 4))            # None unless this R is overridden
+    E_elec, epoch = read_last_ema(bl_dir, window=args.avg_window, at_epoch=at)
+    if E_elec is None:
+        print(f"  bl={R:.4f}: no EMA csv — skipping")
+        continue
+    E_NN   = e_nn(mol_name, R)
+    E_total = E_elec + E_NN           # add nuclear repulsion
+    row = {"R": R, "E_total": E_total, "epoch": epoch}
+    if E_atom is not None:
+        row["bind_Ha"] = E_total - 2.0 * E_atom   # E(H2) - 2E(H)
+    rows.append(row)
+    tag = f"  R={R:.4f}  epoch={epoch:>6}  E={E_total:+.6f} Ha  (E_NN={E_NN:+.4f})"
+    if E_atom is not None:
+        tag += f"  bind={row['bind_Ha']:+.6f} Ha"
+    print(tag)
+if not rows:
+    raise RuntimeError("No data found — check scan_dir.")
+df = pd.DataFrame(rows).sort_values("R").reset_index(drop=True)
+max_epoch = df["epoch"].max()
+complete  = df["epoch"] == max_epoch
+# ── Optional: grid-integration results from scan_pes.py ──────────────────────
+pes_path = Path(args.pes_csv).resolve() if args.pes_csv else scan_dir / "pes.csv"
+pes_df   = None
+if pes_path.exists():
+    pes_df = pd.read_csv(pes_path).sort_values("R_bohr").reset_index(drop=True)
+    if args.bls is not None:
+        keep = {round(bl, 4) for bl in args.bls}
+        pes_df = pes_df[pes_df["R_bohr"].round(4).isin(keep)].reset_index(drop=True)
+    print(f"\nGrid overlay: {pes_path}  ({len(pes_df)} points)")
+else:
+    print(f"\nNo pes.csv at {pes_path} — plotting EMA only")
+# ── Side-by-side binding-energy comparison (EMA vs grid) ─────────────────────
+if pes_df is not None and E_atom is not None and "E_bind_Ha" in pes_df.columns:
+    cmp = df[["R", "bind_Ha"]].merge(
+        pes_df[["R_bohr", "E_bind_Ha"]].rename(columns={"R_bohr": "R",
+                                                        "E_bind_Ha": "grid_bind_Ha"}),
+        on="R", how="outer").sort_values("R").reset_index(drop=True)
+    cmp["delta_Ha"] = cmp["bind_Ha"] - cmp["grid_bind_Ha"]
+    print("\n=== Binding energy: EMA vs grid (Ha) ===")
+    print(f"{'R':>8}  {'EMA':>12}  {'Grid':>12}  {'Δ(EMA-Grid)':>14}")
+    for _, r in cmp.iterrows():
+        ema_s  = f"{r['bind_Ha']:+12.6f}"      if pd.notna(r['bind_Ha'])      else f"{'—':>12}"
+        grid_s = f"{r['grid_bind_Ha']:+12.6f}" if pd.notna(r['grid_bind_Ha']) else f"{'—':>12}"
+        d_s    = f"{r['delta_Ha']:+14.6f}"     if pd.notna(r['delta_Ha'])     else f"{'—':>14}"
+        print(f"{r['R']:8.4f}  {ema_s}  {grid_s}  {d_s}")
+# ── Plot ──────────────────────────────────────────────────────────────────────
+n_panels = 2 if E_atom is not None else 1
+fig, axes = plt.subplots(1, n_panels, figsize=(5 * n_panels + 1, 4))
+if n_panels == 1:
+    axes = [axes]
+R_vals = df["R"].values
+# Panel 1: PES (E_total)
+ax = axes[0]
+ax.plot(R_vals[complete],  df["E_total"].values[complete],
+        "o-", color="tab:blue", lw=1.8, label=f"EMA  (epoch={max_epoch})")
+ax.plot(R_vals[~complete], df["E_total"].values[~complete],
+        "^", color="tab:blue", alpha=0.5, markerfacecolor="none",
+        markersize=7, label="incomplete")
+if pes_df is not None:
+    ax.plot(pes_df["R_bohr"], pes_df["E_total"], "o", color="gold",
+            markersize=6, markeredgecolor="black", markeredgewidth=0.4,
+            linestyle="none", label="scan_pes (grid)", zorder=5)
+ax.set_xlabel("R [Bohr]")
+ax.set_ylabel("E [Ha]")
+ax.set_title("Potential Energy Surface")
+ax.legend(fontsize=8)
+ax.grid(True, alpha=0.25)
+# Panel 2: binding energy  E(mol) - 2 E(atom)
+if E_atom is not None:
+    ax2 = axes[1]
+    ax2.plot(R_vals[complete],  df["bind_Ha"].values[complete],
+             "o-", color="tab:orange", lw=1.8, label=f"EMA  (epoch={max_epoch})")
+    ax2.plot(R_vals[~complete], df["bind_Ha"].values[~complete],
+             "^", color="tab:orange", alpha=0.5, markerfacecolor="none", markersize=7)
+    if pes_df is not None and "E_bind_Ha" in pes_df.columns:
+        # scan_pes already stores E_bind = E(mol) - 2E(atom) — plot directly
+        ax2.plot(pes_df["R_bohr"], pes_df["E_bind_Ha"], "o", color="gold",
+                 markersize=6, markeredgecolor="black", markeredgewidth=0.4,
+                 linestyle="none", label="scan_pes (grid)", zorder=5)
+    ax2.axhline(0, color="k", lw=0.8, ls="--", alpha=0.5)
+    ax2.set_xlabel("R [Bohr]")
+    ax2.set_ylabel(rf"$E({mol_latex}) - 2E(\mathrm{{{atom_sym}}})$  [Ha]")
+    ax2.set_title("Binding Energy")
+    ax2.legend(fontsize=8)
+    ax2.grid(True, alpha=0.25)
+fig.suptitle(scan_dir.name, fontsize=8)
+fig.tight_layout()
+out = scan_dir / "pes_ema.png"
+fig.savefig(out, dpi=150)
+fig.savefig(out.with_suffix(".svg"), transparent=True)
+print(f"\nSaved → {out}")