npm - @team-agent/installer - Versions diffs - 0.3.4 → 0.3.6 - Mend

@team-agent/installer 0.3.4 → 0.3.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (56) hide show

package/Cargo.lock +1 -1
package/Cargo.toml +1 -1
package/crates/team-agent/src/cli/adapters.rs +8 -0
package/crates/team-agent/src/cli/diagnose.rs +51 -10
package/crates/team-agent/src/cli/emit.rs +2 -1
package/crates/team-agent/src/cli/mod.rs +217 -80
package/crates/team-agent/src/cli/send.rs +1 -0
package/crates/team-agent/src/cli/status_port.rs +135 -7
package/crates/team-agent/src/cli/tests/missing_subcommands.rs +8 -1
package/crates/team-agent/src/cli/tests/mod.rs +1 -0
package/crates/team-agent/src/cli/tests/shutdown_kill_plan.rs +39 -0
package/crates/team-agent/src/cli/types.rs +5 -1
package/crates/team-agent/src/coordinator/backoff.rs +57 -9
package/crates/team-agent/src/coordinator/health.rs +65 -2
package/crates/team-agent/src/coordinator/runtime_detectors.rs +28 -16
package/crates/team-agent/src/coordinator/tests/a0_lostupdate.rs +87 -0
package/crates/team-agent/src/coordinator/tests/mod.rs +1 -0
package/crates/team-agent/src/coordinator/tick.rs +195 -43
package/crates/team-agent/src/leader/helpers.rs +2 -0
package/crates/team-agent/src/leader/rediscover.rs +1 -0
package/crates/team-agent/src/leader/start.rs +9 -1
package/crates/team-agent/src/leader/takeover.rs +18 -1
package/crates/team-agent/src/lifecycle/launch.rs +434 -29
package/crates/team-agent/src/lifecycle/profile_launch.rs +110 -4
package/crates/team-agent/src/lifecycle/profile_smoke.rs +4 -1
package/crates/team-agent/src/lifecycle/restart/common.rs +19 -2
package/crates/team-agent/src/lifecycle/tests/agent_ops.rs +2 -2
package/crates/team-agent/src/lifecycle/tests/core.rs +1 -1
package/crates/team-agent/src/lifecycle/tests/lane_ops.rs +4 -4
package/crates/team-agent/src/lifecycle/tests/launch_spawn.rs +3 -1
package/crates/team-agent/src/lifecycle/worker_command_context.rs +44 -9
package/crates/team-agent/src/mcp_server/lifecycle_tools/agent_ops.rs +2 -1
package/crates/team-agent/src/mcp_server/tests/scoped.rs +14 -1
package/crates/team-agent/src/mcp_server/tests/send.rs +15 -1
package/crates/team-agent/src/mcp_server/tools.rs +65 -9
package/crates/team-agent/src/mcp_server/wire.rs +2 -1
package/crates/team-agent/src/message_store.rs +80 -0
package/crates/team-agent/src/messaging/results.rs +76 -5
package/crates/team-agent/src/messaging/send.rs +3 -1
package/crates/team-agent/src/messaging/types.rs +15 -1
package/crates/team-agent/src/messaging/watchers.rs +68 -30
package/crates/team-agent/src/model/enums.rs +7 -1
package/crates/team-agent/src/model/permissions.rs +7 -0
package/crates/team-agent/src/model/spec.rs +3 -1
package/crates/team-agent/src/provider/adapter.rs +472 -7
package/crates/team-agent/src/provider/classify.rs +6 -2
package/crates/team-agent/src/provider/faults.rs +3 -2
package/crates/team-agent/src/provider/startup_prompt.rs +25 -7
package/crates/team-agent/src/provider/types.rs +11 -0
package/crates/team-agent/src/session_capture.rs +1 -0
package/crates/team-agent/src/state/persist.rs +95 -19
package/crates/team-agent/src/tmux_backend/tests.rs +8 -7
package/crates/team-agent/src/tmux_backend.rs +80 -6
package/crates/team-agent/src/transport.rs +32 -0
package/npm/install.mjs +21 -0
package/package.json +4 -4

package/Cargo.lock CHANGED Viewed

@@ -566,7 +566,7 @@ dependencies = [
 [[package]]
 name = "team-agent"
-version = "0.3.4"
+version = "0.3.6"
 dependencies = [
  "anyhow",
  "chrono",

package/Cargo.toml CHANGED Viewed

@@ -9,7 +9,7 @@ members = ["crates/team-agent"]
 [workspace.package]
 edition = "2021"
-version = "0.3.4"
+version = "0.3.6"
 license = "AGPL-3.0"
 rust-version = "1.95"

package/crates/team-agent/src/cli/adapters.rs CHANGED Viewed

@@ -1490,6 +1490,14 @@ pub fn cmd_doctor(args: &DoctorArgs) -> Result<CmdResult, CliError> {
     if args.fix && args.gate.is_none() {
         return Err(CliError::Runtime("--fix requires --gate".to_string()));
     }
+    // swallow batch 3 ①: an unknown gate refuses explicitly (Python commands.py:234-235
+    // `unknown doctor gate`), never an empty default-doctor green.
+    if let Some(DoctorGate::Unknown(raw)) = &args.gate {
+        return Ok(CmdResult::from_json(
+            serde_json::json!({"ok": false, "status": "unknown_gate", "gate": raw}),
+            args.json,
+        ));
+    }
     if args.comms || matches!(args.gate, Some(DoctorGate::Comms)) {
         let value = crate::diagnose::comms::doctor_comms_json(&args.workspace, args.team.as_deref(), Some("comms"))?;
         if !args.json {

package/crates/team-agent/src/cli/diagnose.rs CHANGED Viewed

@@ -289,21 +289,46 @@ fn copy_optional_field(from: &Value, to: &mut Value, key: &str) {
 }
 pub(crate) fn build_wait_ready_report(workspace: &std::path::Path, timeout: f64) -> Result<Value, CliError> {
-    let selected = crate::state::selector::resolve_active_team(
+    // swallow batch 3 ③: an unreadable runtime state must never read as "ready" — the
+    // read error is surfaced verbatim (state_read_error) with ready=false instead of
+    // silently degrading to an empty/stale state.
+    let selected = match crate::state::selector::resolve_active_team(
         workspace,
         None,
         crate::state::selector::SelectorMode::RuntimeOnly,
-    )
-    .map_err(|e| CliError::Runtime(e.to_string()))?;
+    ) {
+        Ok(selected) => selected,
+        Err(error) => {
+            return Ok(json!({
+                "ok": false,
+                "status": "error",
+                "reason": "state_read_error",
+                "state_read_error": error.to_string(),
+                "readiness": {"ready": false},
+                "summary": "runtime state could not be read",
+                "next_actions": [json!("inspect .team/runtime/state.json (corrupt or unreadable) and retry")],
+            }));
+        }
+    };
     let timeout = if timeout.is_finite() && timeout > 0.0 { timeout } else { 0.0 };
     let deadline = std::time::Instant::now() + std::time::Duration::from_secs_f64(timeout);
     let mut readiness;
+    let mut state_read_error: Option<String> = None;
     loop {
-        let mut state = crate::state::projection::select_runtime_state(
+        let mut state = match crate::state::projection::select_runtime_state(
             &selected.run_workspace,
             Some(&selected.team_key),
-        )
-        .unwrap_or_else(|_| selected.state.clone());
+        ) {
+            Ok(state) => {
+                state_read_error = None;
+                state
+            }
+            Err(error) => {
+                state_read_error = Some(error.to_string());
+                readiness = json!({"ready": false, "state_read_error": error.to_string()});
+                break;
+            }
+        };
         inject_tmux_session_present(&selected.run_workspace, &mut state);
         inject_message_counts(&selected.run_workspace, &mut state)?;
         readiness = wait_readiness(&state);
@@ -322,7 +347,15 @@ pub(crate) fn build_wait_ready_report(workspace: &std::path::Path, timeout: f64)
         .and_then(Value::as_bool)
         == Some(true);
     let ready = readiness.get("ready").and_then(Value::as_bool) == Some(true);
-    let (ok, status, reason, summary, next_actions) = if awaiting_trust {
+    let (ok, status, reason, summary, next_actions) = if state_read_error.is_some() {
+        (
+            false,
+            "error",
+            "state_read_error",
+            "runtime state could not be read",
+            vec![json!("inspect .team/runtime/state.json (corrupt or unreadable) and retry")],
+        )
+    } else if awaiting_trust {
         (
             false,
             "pending",
@@ -360,7 +393,7 @@ pub(crate) fn build_wait_ready_report(workspace: &std::path::Path, timeout: f64)
             "readiness": readiness,
         }),
     )?;
-    Ok(json!({
+    let mut report = json!({
         "details_log": details_log.to_string_lossy().to_string(),
         "next_actions": next_actions,
         "ok": ok,
@@ -368,7 +401,11 @@ pub(crate) fn build_wait_ready_report(workspace: &std::path::Path, timeout: f64)
         "readiness": readiness,
         "status": status,
         "summary": summary,
-    }))
+    });
+    if let Some(error) = state_read_error {
+        report["state_read_error"] = json!(error);
+    }
+    Ok(report)
 }
 fn inject_tmux_session_present(workspace: &std::path::Path, state: &mut Value) {
@@ -392,10 +429,12 @@ pub(crate) fn wait_readiness(state: &Value) -> Value {
     let mut task_prompt_delivered = false;
     let mut awaiting_trust_prompt = false;
     let mut incomplete_sessions = Vec::new();
+    // A-5: a missing/unreadable leader_receiver must NOT count as attached —
+    // "unreadable is never ready" (doctor/wait-ready truthfulness rule).
     let all_attached_receiver = state
         .get("leader_receiver")
         .and_then(Value::as_object)
-        .is_none_or(|receiver| {
+        .is_some_and(|receiver| {
             receiver
                 .get("status")
                 .and_then(Value::as_str)
@@ -673,6 +712,7 @@ fn provider_wire(provider: crate::provider::Provider) -> &'static str {
         crate::provider::Provider::Claude => "claude",
         crate::provider::Provider::ClaudeCode => "claude_code",
         crate::provider::Provider::Codex => "codex",
+        crate::provider::Provider::Copilot => "copilot",
         crate::provider::Provider::GeminiCli => "gemini_cli",
         crate::provider::Provider::Fake => "fake",
     }
@@ -682,6 +722,7 @@ fn provider_command(provider: crate::provider::Provider) -> &'static str {
     match provider {
         crate::provider::Provider::Claude | crate::provider::Provider::ClaudeCode => "claude",
         crate::provider::Provider::Codex => "codex",
+        crate::provider::Provider::Copilot => "copilot",
         crate::provider::Provider::GeminiCli => "gemini",
         crate::provider::Provider::Fake => "team-agent fake-worker",
     }

package/crates/team-agent/src/cli/emit.rs CHANGED Viewed

@@ -963,7 +963,8 @@ fn doctor_gate(raw: Option<&str>) -> Option<DoctorGate> {
     match raw {
         Some("orphans") => Some(DoctorGate::Orphans),
         Some("comms") => Some(DoctorGate::Comms),
-        _ => None,
+        Some(other) => Some(DoctorGate::Unknown(other.to_string())),
+        None => None,
     }
 }

package/crates/team-agent/src/cli/mod.rs CHANGED Viewed

@@ -176,11 +176,60 @@ pub mod lifecycle_port {
         let result =
             shutdown_with_transport_and_state(workspace, keep_logs, team, &transport, Some(state));
         if team.is_none() {
-            transport.kill_server();
+            // B5/F1: the leader terminal (`team-agent claude`) lives on this same
+            // workspace socket by design (leader/start.rs); a bare shutdown must not
+            // `kill-server` it away. Spare `team-agent-leader-*` sessions and clear the
+            // remaining non-leader sessions individually; only an empty-of-leader socket
+            // gets the whole-server teardown (the original leak-cleanup intent).
+            let transport_dyn: &dyn crate::transport::Transport = &transport;
+            let sessions = socket_session_names(transport_dyn);
+            match sessions_to_kill_sparing_leader(&sessions) {
+                None => transport.kill_server(),
+                Some(non_leader_sessions) => {
+                    for session in &non_leader_sessions {
+                        let _ = transport_dyn.kill_session(session);
+                    }
+                }
+            }
         }
         result
     }
+    fn socket_session_names(
+        transport: &dyn crate::transport::Transport,
+    ) -> Vec<crate::transport::SessionName> {
+        let mut seen = std::collections::BTreeSet::new();
+        transport
+            .list_targets()
+            .unwrap_or_default()
+            .into_iter()
+            .map(|pane| pane.session)
+            .filter(|session| seen.insert(session.as_str().to_string()))
+            .collect()
+    }
+    /// B5/F1 pure kill decision for the bare-shutdown socket teardown.
+    /// `None` => no `team-agent-leader-*` session on the socket → safe to kill the whole
+    /// server. `Some(rest)` => leader present → kill only the non-leader sessions.
+    pub(crate) fn sessions_to_kill_sparing_leader(
+        sessions: &[crate::transport::SessionName],
+    ) -> Option<Vec<crate::transport::SessionName>> {
+        let leader_present = sessions
+            .iter()
+            .any(|session| session.as_str().starts_with(crate::leader::LEADER_SESSION_PREFIX));
+        leader_present.then(|| {
+            sessions
+                .iter()
+                .filter(|session| {
+                    !session
+                        .as_str()
+                        .starts_with(crate::leader::LEADER_SESSION_PREFIX)
+                })
+                .cloned()
+                .collect()
+        })
+    }
     pub fn shutdown_with_transport(
         workspace: &Path,
         keep_logs: bool,
@@ -223,7 +272,14 @@ pub mod lifecycle_port {
             .and_then(Value::as_str)
             .filter(|s| !s.is_empty())
             .map(crate::transport::SessionName::new);
-        let protected = shutdown_protection_set();
+        // PERF-6 C-①-1: ONE process-table snapshot for the whole happy path; the
+        // protected / pgid / kill / wait sets all derive from it (N39 same-source).
+        // A probe failure is observable, not a silent empty table (swallow batch 1).
+        let mut probe_degraded = false;
+        let entry_table = shutdown_table_snapshot(&run_workspace, &mut probe_degraded, "entry");
+        let mut protected = shutdown_protection_set(&entry_table);
+        extend_protection_with_leader_panes(&mut protected, transport, &entry_table);
+        let protected = protected;
         let reap_scope = if team.is_some() {
             ShutdownReapScope::ScopedTeam
         } else {
@@ -246,11 +302,9 @@ pub mod lifecycle_port {
         root_pids.extend(pane_pids);
         root_pids.sort_unstable();
         root_pids.dedup();
-        let root_pgids = process_pgids(&root_pids, &protected);
+        let root_pgids = process_pgids(&root_pids, &protected, &entry_table);
         deadline.check("reap_process_tree")?;
-        for pid in &root_pids {
-            reap_process_tree(*pid, &protected);
-        }
+        reap_process_tree(&root_pids, &protected, &entry_table);
         reap_process_groups(&root_pgids, &protected);
         let mut kill_error: Option<String> = None;
         deadline.check("kill_session")?;
@@ -267,8 +321,9 @@ pub mod lifecycle_port {
             &state,
             &root_pids,
             &root_pgids,
-            &protected,
+            transport,
             reap_scope,
+            &mut probe_degraded,
         );
         deadline.check("session_residuals")?;
         let session_residuals = if let Some(session) = session_name.as_ref() {
@@ -286,6 +341,10 @@ pub mod lifecycle_port {
             Vec::new()
         };
         deadline.check("process_residuals")?;
+        // C-①: the post-verify gets ONE fresh verification snapshot (reaps changed
+        // the world; #248 post-verify facts must be current, not the entry view).
+        let verify_table =
+            shutdown_table_snapshot(&run_workspace, &mut probe_degraded, "post_verify");
         let process_residuals = process_residuals(
             &run_workspace,
             &state,
@@ -293,6 +352,7 @@ pub mod lifecycle_port {
             &root_pgids,
             &protected,
             reap_scope,
+            &verify_table,
         );
         deadline.check("stop_coordinator")?;
         let mut coordinator_timeout = false;
@@ -313,7 +373,9 @@ pub mod lifecycle_port {
             None
         };
         let probe_timeout = crate::os_probe::probe_timeout();
-        let verification_degraded = probe_timeout.is_some();
+        // swallow batch 1: a failed ps probe degrades verification truthfully — the
+        // empty table must never read as a clean "no residual processes".
+        let verification_degraded = probe_timeout.is_some() || probe_degraded;
         let session_killed = session_name.is_some()
             && kill_error.is_none()
             && session_residuals.is_empty()
@@ -393,6 +455,7 @@ pub mod lifecycle_port {
             "status": status,
             "phase": phase,
             "verification_degraded": verification_degraded,
+            "probe_degraded": probe_degraded,
             "probe_timeout_kind": probe_timeout_kind,
             "probe_timeout": probe_timeout_value,
             "keep_logs": keep_logs,
@@ -574,11 +637,29 @@ pub mod lifecycle_port {
             .filter(|pid| *pid > 0)
     }
-    fn reap_process_tree(root_pid: u32, protected: &ShutdownProtection) {
-        let pids = process_tree_pids(root_pid)
-            .into_iter()
-            .filter(|pid| !protected.contains_pid(*pid))
-            .collect::<Vec<_>>();
+    /// PERF-6 C-② batched signals: the UNION of all root trees gets SIGTERM, shares ONE
+    /// >=150ms grace window (no single pid's grace is shortened — the serial per-root
+    /// chain is what's removed), then the union gets SIGKILL (noop for already-dead
+    /// pids; Gap 37 escalation order TERM -> grace -> KILL preserved), then a single
+    /// bounded wait for the whole union. kill/wait sets derive from the SAME snapshot
+    /// as the protected set (N39).
+    fn reap_process_tree(
+        root_pids: &[u32],
+        protected: &ShutdownProtection,
+        table: &[ProcessInfo],
+    ) {
+        let mut pids = Vec::new();
+        let mut seen = std::collections::BTreeSet::new();
+        for root in root_pids {
+            for pid in process_tree_from_table(*root, table) {
+                if !protected.contains_pid(pid) && seen.insert(pid) {
+                    pids.push(pid);
+                }
+            }
+        }
+        if pids.is_empty() {
+            return;
+        }
         for pid in pids.iter().rev() {
             send_process_signal(*pid, libc::SIGTERM);
         }
@@ -611,86 +692,83 @@ pub mod lifecycle_port {
         }
     }
+    /// PERF-6 C-①-2 + C-②-5: every residual round fetches ONE fresh snapshot (reap
+    /// changed the world) and re-derives the protected set from THAT snapshot; all
+    /// in-round consumers (match + tree walks) reuse it.
     fn reap_workspace_process_residuals(
         workspace: &Path,
         state: &Value,
         root_pids: &[u32],
         root_pgids: &[u32],
-        protected: &ShutdownProtection,
+        transport: &dyn crate::transport::Transport,
         scope: ShutdownReapScope,
+        probe_degraded: &mut bool,
     ) {
         for _ in 0..5 {
-            let residuals =
-                matched_processes(workspace, state, root_pids, root_pgids, protected, scope);
+            let round_table = shutdown_table_snapshot(workspace, probe_degraded, "residual_round");
+            let mut protected = shutdown_protection_set(&round_table);
+            extend_protection_with_leader_panes(&mut protected, transport, &round_table);
+            let residuals = matched_processes(
+                workspace, state, root_pids, root_pgids, &protected, scope, &round_table,
+            );
             if residuals.is_empty() {
                 return;
             }
-            for process in &residuals {
-                reap_process_tree(process.pid, protected);
-            }
+            let residual_pids = residuals.iter().map(|process| process.pid).collect::<Vec<_>>();
+            reap_process_tree(&residual_pids, &protected, &round_table);
             let pgids = residuals
                 .iter()
                 .filter_map(|process| process.pgid)
                 .collect::<Vec<_>>();
-            reap_process_groups(&pgids, protected);
+            reap_process_groups(&pgids, &protected);
             std::thread::sleep(std::time::Duration::from_millis(100));
         }
     }
-    fn process_tree_pids(root_pid: u32) -> Vec<u32> {
-        if root_pid == 0 {
-            return Vec::new();
-        }
-        let pairs = process_parent_pairs();
-        let mut out = vec![root_pid];
-        let mut seen = std::collections::BTreeSet::new();
-        seen.insert(root_pid);
-        let mut index = 0;
-        while index < out.len() {
-            let parent = out[index];
-            for (pid, ppid) in &pairs {
-                if *ppid == parent && seen.insert(*pid) {
-                    out.push(*pid);
-                }
-            }
-            index += 1;
-        }
-        out
-    }
-    fn process_parent_pairs() -> Vec<(u32, u32)> {
-        let output = match crate::os_probe::bounded_command_output_with_probe(
-            std::process::Command::new("ps").args(["-axo", "pid=,ppid="]),
-            "ps_parent",
+    /// swallow batch 1: the raw ps probe with an explicit error channel — a failed
+    /// probe must never masquerade as "no processes" (CLAUDE.md §5).
+    fn probed_process_table() -> Result<Vec<ProcessInfo>, String> {
+        match crate::os_probe::bounded_command_output_with_probe(
+            std::process::Command::new("ps").args(["-axo", "pid=,ppid=,pgid=,sess=,command="]),
+            "ps_table",
             None,
         ) {
-            Ok(output) if output.status.success() => output,
-            _ => return Vec::new(),
-        };
-        String::from_utf8_lossy(&output.stdout)
-            .lines()
-            .filter_map(|line| {
-                let mut parts = line.split_whitespace();
-                let pid = parts.next()?.parse::<u32>().ok()?;
-                let ppid = parts.next()?.parse::<u32>().ok()?;
-                Some((pid, ppid))
-            })
-            .collect()
+            Ok(output) if output.status.success() => Ok(String::from_utf8_lossy(&output.stdout)
+                .lines()
+                .filter_map(parse_process_info)
+                .collect()),
+            Ok(output) => Err(format!("ps exited with status {:?}", output.status.code())),
+            Err(error) => Err(error.to_string()),
+        }
     }
     fn process_table() -> Vec<ProcessInfo> {
-        let output = match crate::os_probe::bounded_command_output_with_probe(
-            std::process::Command::new("ps").args(["-axo", "pid=,ppid=,pgid=,sess=,command="]),
-            "ps_table",
-            None,
-        ) {
-            Ok(output) if output.status.success() => output,
-            _ => return Vec::new(),
-        };
-        String::from_utf8_lossy(&output.stdout)
-            .lines()
-            .filter_map(parse_process_info)
-            .collect()
+        probed_process_table().unwrap_or_default()
+    }
+    /// PERF-6 C-①-1 / swallow batch 1: the shutdown-scope snapshot fetch. A probe
+    /// failure writes a `shutdown.process_probe_failed` event (non-null error) and
+    /// marks the run degraded instead of silently treating it as "no processes".
+    fn shutdown_table_snapshot(
+        workspace: &Path,
+        probe_degraded: &mut bool,
+        phase: &str,
+    ) -> Vec<ProcessInfo> {
+        match probed_process_table() {
+            Ok(table) => table,
+            Err(error) => {
+                *probe_degraded = true;
+                let _ = crate::event_log::EventLog::new(workspace).write(
+                    "shutdown.process_probe_failed",
+                    json!({
+                        "phase": phase,
+                        "probe": "ps_table",
+                        "error": error,
+                    }),
+                );
+                Vec::new()
+            }
+        }
     }
     fn parse_process_info(line: &str) -> Option<ProcessInfo> {
@@ -739,8 +817,9 @@ pub mod lifecycle_port {
         }
     }
-    fn shutdown_protection_set() -> ShutdownProtection {
-        let table = process_table();
+    /// PERF-6 C-①-1/C-②-4 (N39): the protected set derives from the CALLER's snapshot —
+    /// the same table the kill/wait sets derive from.
+    fn shutdown_protection_set(table: &[ProcessInfo]) -> ShutdownProtection {
         let mut protected = ShutdownProtection::default();
         let current = std::process::id();
         protected.pids.insert(current);
@@ -765,6 +844,61 @@ pub mod lifecycle_port {
         protected
     }
+    /// B5/F2: the leader terminal's pane process tree joins the protected set (same
+    /// set, same mechanism as the invoker ancestry) so the workspace residual sweep's
+    /// cmdline/cwd matching cannot reap the leader — including when ANOTHER team's bare
+    /// shutdown runs, where the leader is never in the invoker's ancestry.
+    fn extend_protection_with_leader_panes(
+        protected: &mut ShutdownProtection,
+        transport: &dyn crate::transport::Transport,
+        table: &[ProcessInfo],
+    ) {
+        let leader_pane_pids: Vec<u32> = transport
+            .list_targets()
+            .unwrap_or_default()
+            .into_iter()
+            .filter(|pane| {
+                pane.session
+                    .as_str()
+                    .starts_with(crate::leader::LEADER_SESSION_PREFIX)
+            })
+            .filter_map(|pane| pane.pane_pid)
+            .collect();
+        if leader_pane_pids.is_empty() {
+            return;
+        }
+        for root in &leader_pane_pids {
+            for pid in process_tree_from_table(*root, table) {
+                protected.pids.insert(pid);
+                if let Some(pgid) = table
+                    .iter()
+                    .find(|process| process.pid == pid)
+                    .and_then(|process| process.pgid)
+                {
+                    protected.pgids.insert(pgid);
+                }
+            }
+        }
+        // The tmux SERVER carrying the leader pane must survive too: its command line
+        // contains the workspace path (it was started with the worker spawn command), so
+        // the residual sweep matches it, and killing the server SIGHUPs every pane —
+        // including the protected leader — bypassing per-pid protection. Protect the
+        // server pid itself (NOT its tree: worker panes must still die).
+        for pane_pid in &leader_pane_pids {
+            if let Some(server) = table
+                .iter()
+                .find(|process| process.pid == *pane_pid)
+                .and_then(|pane| table.iter().find(|process| process.pid == pane.ppid))
+                .filter(|server| server.pid > 1)
+            {
+                protected.pids.insert(server.pid);
+                if let Some(pgid) = server.pgid {
+                    protected.pgids.insert(pgid);
+                }
+            }
+        }
+    }
     fn send_process_signal(pid: u32, signal: libc::c_int) {
         let Ok(pid_t) = libc::pid_t::try_from(pid) else {
             return;
@@ -815,8 +949,11 @@ pub mod lifecycle_port {
         err.raw_os_error() == Some(libc::EPERM)
     }
-    fn process_pgids(pids: &[u32], protected: &ShutdownProtection) -> Vec<u32> {
-        let table = process_table();
+    fn process_pgids(
+        pids: &[u32],
+        protected: &ShutdownProtection,
+        table: &[ProcessInfo],
+    ) -> Vec<u32> {
         let mut pgids = pids
             .iter()
             .filter_map(|pid| table.iter().find(|process| process.pid == *pid))
@@ -839,9 +976,10 @@ pub mod lifecycle_port {
         root_pgids: &[u32],
         protected: &ShutdownProtection,
         scope: ShutdownReapScope,
+        table: &[ProcessInfo],
     ) -> Vec<Value> {
         let mut residuals =
-            matched_processes(workspace, state, root_pids, root_pgids, protected, scope);
+            matched_processes(workspace, state, root_pids, root_pgids, protected, scope, table);
         let mut seen = residuals
             .iter()
             .map(|process| process.pid)
@@ -878,11 +1016,11 @@ pub mod lifecycle_port {
         root_pgids: &[u32],
         protected: &ShutdownProtection,
         scope: ShutdownReapScope,
+        table: &[ProcessInfo],
     ) -> Vec<ProcessInfo> {
-        let table = process_table();
         let root_tree = root_pids
             .iter()
-            .flat_map(|pid| process_tree_from_table(*pid, &table))
+            .flat_map(|pid| process_tree_from_table(*pid, table))
             .filter(|pid| !protected.contains_pid(*pid))
             .collect::<std::collections::BTreeSet<_>>();
         let root_pgids = root_pgids
@@ -899,7 +1037,7 @@ pub mod lifecycle_port {
             }
             let matches_workspace = scope == ShutdownReapScope::Workspace
                 && process_matches_workspace(
-                    &process,
+                    process,
                     &workspace_text,
                     &spawn_cwds,
                     &mut cwd_probe_budget,
@@ -908,7 +1046,7 @@ pub mod lifecycle_port {
                 || root_tree.contains(&process.pid)
                 || process.pgid.is_some_and(|pgid| root_pgids.contains(&pgid))
             {
-                out.push(process);
+                out.push(process.clone());
             }
         }
         out
@@ -1132,10 +1270,9 @@ pub mod lifecycle_port {
         open_display: bool,
         team: Option<&str>,
     ) -> Result<Value, CliError> {
-        let _ = label;
         let source = crate::model::ids::AgentId::new(source_agent);
         let dest = crate::model::ids::AgentId::new(as_agent_id);
-        match crate::lifecycle::fork_agent(workspace, &source, &dest, open_display, team) {
+        match crate::lifecycle::fork_agent(workspace, &source, &dest, label, open_display, team) {
             Ok(report) => Ok(json!({
                 "ok": true,
                 "source_agent_id": report.source_agent_id.as_str(),

package/crates/team-agent/src/cli/send.rs CHANGED Viewed

@@ -202,6 +202,7 @@ fn delivery_refusal_wire(reason: DeliveryRefusal) -> &'static str {
         DeliveryRefusal::SessionDrift => "session_drift",
         DeliveryRefusal::Duplicate => "duplicate",
         DeliveryRefusal::RoutingAmbiguous => "routing_ambiguous",
+        DeliveryRefusal::EmptyTargetList => "empty_target_list",
     }
 }