PyPI - cogames - Versions diffs - 0.3.49__py3-none-any.whl → 0.3.64__py3-none-any.whl - Mend

cogames 0.3.49py3-none-any.whl → 0.3.64py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (169) hide show

cogames/cli/client.py +60 -6
cogames/cli/docsync/__init__.py +0 -0
cogames/cli/docsync/_nb_md_directive_processing.py +180 -0
cogames/cli/docsync/_nb_md_sync.py +103 -0
cogames/cli/docsync/_nb_py_sync.py +122 -0
cogames/cli/docsync/_three_way_sync.py +115 -0
cogames/cli/docsync/_utils.py +76 -0
cogames/cli/docsync/docsync.py +156 -0
cogames/cli/leaderboard.py +112 -28
cogames/cli/mission.py +64 -53
cogames/cli/policy.py +46 -10
cogames/cli/submit.py +268 -67
cogames/cogs_vs_clips/cog.py +79 -0
cogames/cogs_vs_clips/cogs_vs_clips_mapgen.md +19 -16
cogames/cogs_vs_clips/cogsguard_reward_variants.py +153 -0
cogames/cogs_vs_clips/cogsguard_tutorial.py +56 -0
cogames/cogs_vs_clips/evals/README.md +10 -16
cogames/cogs_vs_clips/evals/cogsguard_evals.py +81 -0
cogames/cogs_vs_clips/evals/diagnostic_evals.py +49 -444
cogames/cogs_vs_clips/evals/difficulty_variants.py +13 -326
cogames/cogs_vs_clips/evals/integrated_evals.py +5 -45
cogames/cogs_vs_clips/evals/spanning_evals.py +9 -180
cogames/cogs_vs_clips/mission.py +187 -146
cogames/cogs_vs_clips/missions.py +46 -137
cogames/cogs_vs_clips/procedural.py +8 -8
cogames/cogs_vs_clips/sites.py +107 -3
cogames/cogs_vs_clips/stations.py +198 -186
cogames/cogs_vs_clips/tutorial_missions.py +1 -1
cogames/cogs_vs_clips/variants.py +25 -476
cogames/device.py +13 -1
cogames/{policy/scripted_agent/README.md → docs/SCRIPTED_AGENT.md} +82 -58
cogames/evaluate.py +18 -30
cogames/main.py +1434 -243
cogames/maps/canidate1_1000.map +1 -1
cogames/maps/canidate1_1000_stations.map +2 -2
cogames/maps/canidate1_500.map +1 -1
cogames/maps/canidate1_500_stations.map +2 -2
cogames/maps/canidate2_1000.map +1 -1
cogames/maps/canidate2_1000_stations.map +2 -2
cogames/maps/canidate2_500.map +1 -1
cogames/maps/canidate2_500_stations.map +2 -2
cogames/maps/canidate3_1000.map +1 -1
cogames/maps/canidate3_1000_stations.map +2 -2
cogames/maps/canidate3_500.map +1 -1
cogames/maps/canidate3_500_stations.map +2 -2
cogames/maps/canidate4_500.map +1 -1
cogames/maps/canidate4_500_stations.map +2 -2
cogames/maps/cave_base_50.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_agile.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_agile_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_charge_up.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_charge_up_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation1.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation1_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation2.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation2_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation3.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_navigation3_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_near.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_search.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_chest_search_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_extract_lab.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_extract_lab_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_memory.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_memory_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_radial.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_radial_hard.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_resource_lab.map +2 -2
cogames/maps/diagnostic_evals/diagnostic_unclip.map +2 -2
cogames/maps/evals/eval_balanced_spread.map +9 -5
cogames/maps/evals/eval_clip_oxygen.map +9 -5
cogames/maps/evals/eval_collect_resources.map +9 -5
cogames/maps/evals/eval_collect_resources_hard.map +9 -5
cogames/maps/evals/eval_collect_resources_medium.map +9 -5
cogames/maps/evals/eval_divide_and_conquer.map +9 -5
cogames/maps/evals/eval_energy_starved.map +9 -5
cogames/maps/evals/eval_multi_coordinated_collect_hard.map +9 -5
cogames/maps/evals/eval_oxygen_bottleneck.map +9 -5
cogames/maps/evals/eval_single_use_world.map +9 -5
cogames/maps/evals/extractor_hub_100x100.map +9 -5
cogames/maps/evals/extractor_hub_30x30.map +9 -5
cogames/maps/evals/extractor_hub_50x50.map +9 -5
cogames/maps/evals/extractor_hub_70x70.map +9 -5
cogames/maps/evals/extractor_hub_80x80.map +9 -5
cogames/maps/machina_100_stations.map +2 -2
cogames/maps/machina_200_stations.map +2 -2
cogames/maps/machina_200_stations_small.map +2 -2
cogames/maps/machina_eval_exp01.map +2 -2
cogames/maps/machina_eval_template_large.map +2 -2
cogames/maps/machinatrainer4agents.map +2 -2
cogames/maps/machinatrainer4agentsbase.map +2 -2
cogames/maps/machinatrainerbig.map +2 -2
cogames/maps/machinatrainersmall.map +2 -2
cogames/maps/planky_evals/aligner_avoid_aoe.map +28 -0
cogames/maps/planky_evals/aligner_full_cycle.map +28 -0
cogames/maps/planky_evals/aligner_gear.map +24 -0
cogames/maps/planky_evals/aligner_hearts.map +24 -0
cogames/maps/planky_evals/aligner_junction.map +26 -0
cogames/maps/planky_evals/exploration_distant.map +28 -0
cogames/maps/planky_evals/maze.map +32 -0
cogames/maps/planky_evals/miner_best_resource.map +26 -0
cogames/maps/planky_evals/miner_deposit.map +24 -0
cogames/maps/planky_evals/miner_extract.map +26 -0
cogames/maps/planky_evals/miner_full_cycle.map +28 -0
cogames/maps/planky_evals/miner_gear.map +24 -0
cogames/maps/planky_evals/multi_role.map +28 -0
cogames/maps/planky_evals/resource_chain.map +30 -0
cogames/maps/planky_evals/scout_explore.map +32 -0
cogames/maps/planky_evals/scout_gear.map +24 -0
cogames/maps/planky_evals/scrambler_full_cycle.map +28 -0
cogames/maps/planky_evals/scrambler_gear.map +24 -0
cogames/maps/planky_evals/scrambler_target.map +26 -0
cogames/maps/planky_evals/stuck_corridor.map +32 -0
cogames/maps/planky_evals/survive_retreat.map +26 -0
cogames/maps/training_facility_clipped.map +2 -2
cogames/maps/training_facility_open_1.map +2 -2
cogames/maps/training_facility_open_2.map +2 -2
cogames/maps/training_facility_open_3.map +2 -2
cogames/maps/training_facility_tight_4.map +2 -2
cogames/maps/training_facility_tight_5.map +2 -2
cogames/maps/vanilla_large.map +2 -2
cogames/maps/vanilla_small.map +2 -2
cogames/pickup.py +183 -0
cogames/play.py +166 -33
cogames/policy/chaos_monkey.py +54 -0
cogames/policy/nim_agents/__init__.py +27 -10
cogames/policy/nim_agents/agents.py +121 -60
cogames/policy/nim_agents/thinky_eval.py +35 -222
cogames/policy/pufferlib_policy.py +67 -32
cogames/policy/starter_agent.py +184 -0
cogames/policy/trainable_policy_template.py +4 -1
cogames/train.py +51 -13
cogames/verbose.py +2 -2
cogames-0.3.64.dist-info/METADATA +1842 -0
cogames-0.3.64.dist-info/RECORD +159 -0
cogames-0.3.64.dist-info/licenses/LICENSE +21 -0
cogames-0.3.64.dist-info/top_level.txt +2 -0
metta_alo/__init__.py +0 -0
metta_alo/job_specs.py +17 -0
metta_alo/policy.py +16 -0
metta_alo/pure_single_episode_runner.py +75 -0
metta_alo/py.typed +0 -0
metta_alo/rollout.py +322 -0
metta_alo/scoring.py +168 -0
cogames/maps/diagnostic_evals/diagnostic_assembler_near.map +0 -49
cogames/maps/diagnostic_evals/diagnostic_assembler_search.map +0 -49
cogames/maps/diagnostic_evals/diagnostic_assembler_search_hard.map +0 -89
cogames/policy/nim_agents/common.nim +0 -887
cogames/policy/nim_agents/install.sh +0 -1
cogames/policy/nim_agents/ladybug_agent.nim +0 -984
cogames/policy/nim_agents/nim_agents.nim +0 -55
cogames/policy/nim_agents/nim_agents.nims +0 -14
cogames/policy/nim_agents/nimby.lock +0 -3
cogames/policy/nim_agents/racecar_agents.nim +0 -884
cogames/policy/nim_agents/random_agents.nim +0 -68
cogames/policy/nim_agents/test_agents.py +0 -53
cogames/policy/nim_agents/thinky_agents.nim +0 -717
cogames/policy/scripted_agent/baseline_agent.py +0 -1049
cogames/policy/scripted_agent/demo_policy.py +0 -244
cogames/policy/scripted_agent/pathfinding.py +0 -126
cogames/policy/scripted_agent/starter_agent.py +0 -136
cogames/policy/scripted_agent/types.py +0 -235
cogames/policy/scripted_agent/unclipping_agent.py +0 -476
cogames/policy/scripted_agent/utils.py +0 -385
cogames-0.3.49.dist-info/METADATA +0 -406
cogames-0.3.49.dist-info/RECORD +0 -136
cogames-0.3.49.dist-info/top_level.txt +0 -1
{cogames-0.3.49.dist-info → cogames-0.3.64.dist-info}/WHEEL +0 -0
{cogames-0.3.49.dist-info → cogames-0.3.64.dist-info}/entry_points.txt +0 -0

cogames/train.py CHANGED Viewed

@@ -24,7 +24,7 @@ from mettagrid.policy.loader import (
 )
 from mettagrid.policy.policy import PolicySpec
 from mettagrid.policy.policy_env_interface import PolicyEnvInterface
-from mettagrid.policy.submission import POLICY_SPEC_FILENAME
+from mettagrid.policy.submission import POLICY_SPEC_FILENAME, SubmissionPolicySpec, write_submission_policy_spec
 from mettagrid.simulator import Simulator
 from mettagrid.util.stats_writer import NoopStatsWriter
 from pufferlib import pufferl
@@ -76,6 +76,25 @@ def _resolve_vector_counts(
     return num_envs, num_workers
+def _align_minibatch_size(minibatch_size: int, batch_size: int, bptt_horizon: int) -> int:
+    if bptt_horizon <= 1:
+        return minibatch_size
+    if minibatch_size < bptt_horizon:
+        return bptt_horizon
+    remainder = minibatch_size % bptt_horizon
+    if remainder == 0:
+        return minibatch_size
+    rounded_up = minibatch_size + (bptt_horizon - remainder)
+    if rounded_up <= batch_size:
+        return rounded_up
+    rounded_down = minibatch_size - remainder
+    return max(bptt_horizon, rounded_down)
 def train(
     env_cfg: Optional[MettaGridConfig],
     policy_class_path: str,
@@ -86,12 +105,14 @@ def train(
     seed: int,
     batch_size: int,
     minibatch_size: int,
+    map_seed: Optional[int] = None,
     missions_arg: Optional[list[str]] = None,
     vector_num_envs: Optional[int] = None,
     vector_batch_size: Optional[int] = None,
     vector_num_workers: Optional[int] = None,
     env_cfg_supplier: Optional[Callable[[], MettaGridConfig]] = None,
     log_outputs: bool = False,
+    checkpoint_interval: int = 200,
 ) -> None:
     console = Console()
@@ -101,7 +122,6 @@ def train(
     backend = pvector.Multiprocessing
     if platform.system() == "Darwin":
         multiprocessing.set_start_method("spawn", force=True)
-        backend = pvector.Serial
     try:
         cpu_cores = psutil.cpu_count(logical=False) or psutil.cpu_count(logical=True)
@@ -121,7 +141,7 @@ def train(
     else:
         num_workers = desired_workers
-    if backend is pvector.Multiprocessing and device.type != "cuda":
+    if backend is pvector.Multiprocessing and device.type not in ("cuda", "mps"):
         backend = pvector.Serial
         num_workers = 1
@@ -175,7 +195,7 @@ def train(
         envs_per_worker,
     )
-    env_creator = _EnvCreator(env_cfg, env_cfg_supplier)
+    env_creator = _EnvCreator(env_cfg, env_cfg_supplier, map_seed, seed)
     base_cfg = env_creator.clone_cfg()
     vecenv = pvector.make(
@@ -242,6 +262,16 @@ def train(
             amended_minibatch_size,
         )
+    aligned_minibatch_size = _align_minibatch_size(amended_minibatch_size, amended_batch_size, bptt_horizon)
+    if aligned_minibatch_size != amended_minibatch_size:
+        logger.info(
+            "Adjusting minibatch_size from %s to %s to align with bptt_horizon=%s",
+            amended_minibatch_size,
+            aligned_minibatch_size,
+            bptt_horizon,
+        )
+        amended_minibatch_size = aligned_minibatch_size
     effective_timesteps = max(num_steps, amended_batch_size)
     if effective_timesteps != num_steps:
         logger.info(
@@ -250,7 +280,6 @@ def train(
             effective_timesteps,
         )
-    checkpoint_interval = 200
     train_args = dict(
         env=env_name,
         device=device.type,
@@ -285,6 +314,7 @@ def train(
         vtrace_c_clip=1.0,
         prio_alpha=0.8,
         prio_beta0=0.2,
+        min_lr_ratio=0.0,
     )
     trainer = pufferl.PuffeRL(train_args, vecenv, policy.network())
@@ -354,13 +384,17 @@ def train(
             )
             console.print("=" * 80, style="bold green")
-        checkpoints = sorted(
-            {path.parent for path in checkpoints_path.rglob(POLICY_SPEC_FILENAME)},
-            key=lambda path: path.stat().st_mtime,
-        )
+        run_dir = checkpoints_path / trainer.logger.run_id
+        checkpoints = sorted(run_dir.glob("model_*.pt"), key=lambda path: path.stat().st_mtime)
         if checkpoints and not training_diverged:
             final_checkpoint = checkpoints[-1]
+            spec = SubmissionPolicySpec(
+                class_path=policy_class_path,
+                data_path=final_checkpoint.name,
+            )
+            write_submission_policy_spec(run_dir / POLICY_SPEC_FILENAME, spec)
             console.print()
             console.print(f"Final checkpoint: [cyan]{final_checkpoint}[/cyan]")
             if trainer.epoch < checkpoint_interval:
@@ -409,9 +443,13 @@ class _EnvCreator:
         self,
         env_cfg: Optional[MettaGridConfig],
         env_cfg_supplier: Optional[Callable[[], MettaGridConfig]],
+        map_seed: Optional[int],
+        fallback_seed: Optional[int],
     ) -> None:
         self._env_cfg = env_cfg
         self._env_cfg_supplier = env_cfg_supplier
+        self._map_seed = map_seed
+        self._fallback_seed = fallback_seed
     def clone_cfg(self) -> MettaGridConfig:
         if self._env_cfg_supplier is not None:
@@ -430,11 +468,11 @@ class _EnvCreator:
     ) -> PufferMettaGridEnv:
         target_cfg = cfg.model_copy(deep=True) if cfg is not None else self.clone_cfg()
-        # If this mission uses MapGen and the builder seed is unset, derive a deterministic
-        # MapGen seed from the per-env seed provided by the vectorized runner.
         map_builder = getattr(target_cfg.game, "map_builder", None)
-        if isinstance(map_builder, MapGen.Config) and seed is not None and map_builder.seed is None:
-            map_builder.seed = seed
+        if isinstance(map_builder, MapGen.Config):
+            base_seed = self._map_seed if self._map_seed is not None else self._fallback_seed
+            if base_seed is not None and (self._map_seed is not None or map_builder.seed is None):
+                map_builder.seed = base_seed + (seed or 0)
         simulator = Simulator()
         simulator.add_event_handler(StatsTracker(NoopStatsWriter()))
         simulator.add_event_handler(EarlyResetHandler())

cogames/verbose.py CHANGED Viewed

@@ -4,14 +4,14 @@ import json
 from rich.console import Console
-from cogames.cogs_vs_clips.mission import Mission
+from cogames.cogs_vs_clips.mission import AnyMission
 from mettagrid.config.mettagrid_config import MettaGridConfig
 def print_configs(
     console: Console,
     env_cfg: MettaGridConfig,
-    mission_cfg: Mission | None = None,
+    mission_cfg: AnyMission | None = None,
     print_cvc_config: bool = False,
     print_mg_config: bool = False,
 ) -> None:

cogames 0.3.49__py3-none-any.whl → 0.3.64__py3-none-any.whl

cogames 0.3.49py3-none-any.whl → 0.3.64py3-none-any.whl