PyPI - gr-libs - Versions diffs - 0.1.8__py3-none-any.whl → 0.2.2__py3-none-any.whl - Mend

gr-libs 0.1.8py3-none-any.whl → 0.2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (68) hide show

gr_libs/__init__.py +3 -1
gr_libs/_evaluation/__init__.py +1 -0
evaluation/analyze_results_cross_alg_cross_domain.py → gr_libs/_evaluation/_analyze_results_cross_alg_cross_domain.py +81 -88
evaluation/generate_experiments_results.py → gr_libs/_evaluation/_generate_experiments_results.py +6 -6
evaluation/generate_task_specific_statistics_plots.py → gr_libs/_evaluation/_generate_task_specific_statistics_plots.py +11 -14
evaluation/get_plans_images.py → gr_libs/_evaluation/_get_plans_images.py +3 -4
evaluation/increasing_and_decreasing_.py → gr_libs/_evaluation/_increasing_and_decreasing_.py +3 -1
gr_libs/_version.py +2 -2
gr_libs/all_experiments.py +294 -0
gr_libs/environment/__init__.py +14 -1
gr_libs/environment/{utils → _utils}/utils.py +1 -1
gr_libs/environment/environment.py +257 -22
gr_libs/metrics/__init__.py +2 -0
gr_libs/metrics/metrics.py +166 -31
gr_libs/ml/__init__.py +1 -6
gr_libs/ml/base/__init__.py +3 -1
gr_libs/ml/base/rl_agent.py +68 -3
gr_libs/ml/neural/__init__.py +1 -3
gr_libs/ml/neural/deep_rl_learner.py +227 -67
gr_libs/ml/neural/utils/__init__.py +1 -2
gr_libs/ml/planner/mcts/{utils → _utils}/tree.py +1 -1
gr_libs/ml/planner/mcts/mcts_model.py +71 -34
gr_libs/ml/sequential/__init__.py +0 -1
gr_libs/ml/sequential/{lstm_model.py → _lstm_model.py} +11 -14
gr_libs/ml/tabular/__init__.py +1 -3
gr_libs/ml/tabular/tabular_q_learner.py +27 -9
gr_libs/ml/tabular/tabular_rl_agent.py +22 -9
gr_libs/ml/utils/__init__.py +2 -9
gr_libs/ml/utils/format.py +13 -90
gr_libs/ml/utils/math.py +3 -2
gr_libs/ml/utils/other.py +2 -2
gr_libs/ml/utils/storage.py +41 -94
gr_libs/odgr_executor.py +268 -0
gr_libs/problems/consts.py +2 -2
gr_libs/recognizer/_utils/__init__.py +0 -0
gr_libs/recognizer/{utils → _utils}/format.py +2 -2
gr_libs/recognizer/gr_as_rl/gr_as_rl_recognizer.py +116 -36
gr_libs/recognizer/graml/{gr_dataset.py → _gr_dataset.py} +11 -11
gr_libs/recognizer/graml/graml_recognizer.py +172 -29
gr_libs/recognizer/recognizer.py +59 -10
gr_libs/tutorials/draco_panda_tutorial.py +58 -0
gr_libs/tutorials/draco_parking_tutorial.py +56 -0
{tutorials → gr_libs/tutorials}/gcdraco_panda_tutorial.py +5 -9
{tutorials → gr_libs/tutorials}/gcdraco_parking_tutorial.py +3 -7
{tutorials → gr_libs/tutorials}/graml_minigrid_tutorial.py +2 -2
{tutorials → gr_libs/tutorials}/graml_panda_tutorial.py +5 -10
{tutorials → gr_libs/tutorials}/graml_parking_tutorial.py +5 -9
{tutorials → gr_libs/tutorials}/graml_point_maze_tutorial.py +2 -1
{tutorials → gr_libs/tutorials}/graql_minigrid_tutorial.py +2 -2
{gr_libs-0.1.8.dist-info → gr_libs-0.2.2.dist-info}/METADATA +84 -29
gr_libs-0.2.2.dist-info/RECORD +71 -0
{gr_libs-0.1.8.dist-info → gr_libs-0.2.2.dist-info}/WHEEL +1 -1
gr_libs-0.2.2.dist-info/top_level.txt +2 -0
tests/test_draco.py +14 -0
tests/test_gcdraco.py +2 -2
tests/test_graml.py +4 -4
tests/test_graql.py +1 -1
evaluation/create_minigrid_map_image.py +0 -38
evaluation/file_system.py +0 -53
evaluation/generate_experiments_results_new_ver1.py +0 -238
evaluation/generate_experiments_results_new_ver2.py +0 -331
gr_libs/ml/neural/utils/penv.py +0 -60
gr_libs/recognizer/utils/__init__.py +0 -1
gr_libs-0.1.8.dist-info/RECORD +0 -70
gr_libs-0.1.8.dist-info/top_level.txt +0 -4
/gr_libs/environment/{utils → _utils}/__init__.py +0 -0
/gr_libs/ml/planner/mcts/{utils → _utils}/__init__.py +0 -0
/gr_libs/ml/planner/mcts/{utils → _utils}/node.py +0 -0

gr_libs/ml/utils/storage.py CHANGED Viewed

@@ -1,10 +1,4 @@
-import csv
 import os
-import torch
-import logging
-import sys
-from .other import device
 def create_folders_if_necessary(path):
@@ -12,23 +6,34 @@ def create_folders_if_necessary(path):
         os.makedirs(path)
-def get_storage_framework_dir(recognizer: str):
-    return os.path.join(get_storage_dir(), recognizer)
+def get_outputs_dir():
+    return "outputs"
+def get_recognizer_outputs_dir(recognizer: str):
+    return os.path.join(get_outputs_dir(), recognizer)
-def get_storage_dir():
+def get_gr_cache_dir():
     # Prefer local directory if it exists (e.g., in GitHub workspace)
-    if os.path.exists("dataset"):
-        return "dataset"
+    if os.path.exists("gr_cache"):
+        return "gr_cache"
     # Fall back to pre-mounted directory (e.g., in Docker container)
-    if os.path.exists("/preloaded_data"):
-        return "/preloaded_data"
+    if os.path.exists("/gr_cache"):
+        return "/gr_cache"
     # Default to "dataset" even if it doesn't exist (e.g., will be created)
-    return "dataset"
+    return "gr_cache"
-def _get_models_directory_name():
-    return "models"
+def get_trained_agents_dir():
+    # Prefer local directory if it exists (e.g., in GitHub workspace)
+    if os.path.exists("trained_agents"):
+        return "trained_agents"
+    # Fall back to pre-mounted directory (e.g., in Docker container)
+    if os.path.exists("/trained_agents"):
+        return "/trained_agents"
+    # Default to "dataset" even if it doesn't exist (e.g., will be created)
+    return "trained_agents"
 def _get_siamese_datasets_directory_name():
@@ -43,25 +48,26 @@ def get_observation_file_name(observability_percentage: float):
     return "obs" + str(observability_percentage) + ".pkl"
-def get_domain_dir(domain_name, recognizer: str):
-    return os.path.join(get_storage_framework_dir(recognizer), domain_name)
+def get_domain_outputs_dir(domain_name, recognizer: str):
+    return os.path.join(get_recognizer_outputs_dir(recognizer), domain_name)
-def get_env_dir(domain_name, env_name, recognizer: str):
-    return os.path.join(get_domain_dir(domain_name, recognizer), env_name)
+def get_env_outputs_dir(domain_name, env_name, recognizer: str):
+    return os.path.join(get_domain_outputs_dir(domain_name, recognizer), env_name)
 def get_observations_dir(domain_name, env_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name=domain_name, env_name=env_name, recognizer=recognizer),
+        get_env_outputs_dir(
+            domain_name=domain_name, env_name=env_name, recognizer=recognizer
+        ),
         _get_observations_directory_name(),
     )
 def get_agent_model_dir(domain_name, model_name, class_name):
     return os.path.join(
-        get_storage_dir(),
-        _get_models_directory_name(),
+        get_trained_agents_dir(),
         domain_name,
         model_name,
         class_name,
@@ -70,15 +76,7 @@ def get_agent_model_dir(domain_name, model_name, class_name):
 def get_lstm_model_dir(domain_name, env_name, model_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name=domain_name, env_name=env_name, recognizer=recognizer),
-        model_name,
-    )
-def get_models_dir(domain_name, env_name, recognizer: str):
-    return os.path.join(
-        get_env_dir(domain_name=domain_name, env_name=env_name, recognizer=recognizer),
-        _get_models_directory_name(),
+        get_gr_cache_dir(), recognizer, domain_name, env_name, model_name
     )
@@ -94,14 +92,7 @@ def get_siamese_dataset_path(domain_name, env_name, model_name, recognizer: str)
 def get_embeddings_result_path(domain_name, env_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name, env_name=env_name, recognizer=recognizer),
-        "goal_embeddings",
-    )
-def get_embeddings_result_path(domain_name, env_name, recognizer: str):
-    return os.path.join(
-        get_env_dir(domain_name, env_name=env_name, recognizer=recognizer),
+        get_env_outputs_dir(domain_name, env_name=env_name, recognizer=recognizer),
         "goal_embeddings",
     )
@@ -113,9 +104,7 @@ def get_and_create(path):
 def get_experiment_results_path(domain, env_name, task, recognizer: str):
     return os.path.join(
-        get_env_dir(domain, env_name=env_name, recognizer=recognizer),
-        "experiment_results",
-        env_name,
+        get_env_outputs_dir(domain, env_name=env_name, recognizer=recognizer),
         task,
         "experiment_results",
     )
@@ -123,72 +112,30 @@ def get_experiment_results_path(domain, env_name, task, recognizer: str):
 def get_plans_result_path(domain_name, env_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name, env_name=env_name, recognizer=recognizer), "plans"
+        get_env_outputs_dir(domain_name, env_name=env_name, recognizer=recognizer),
+        "plans",
     )
 def get_policy_sequences_result_path(domain_name, env_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name, env_name, recognizer=recognizer), "policy_sequences"
+        get_env_outputs_dir(domain_name, env_name, recognizer=recognizer),
+        "policy_sequences",
     )
 ### END GRAML PATHS ###
-""
 ### GRAQL PATHS ###
 def get_gr_as_rl_experiment_confidence_path(domain_name, env_name, recognizer: str):
     return os.path.join(
-        get_env_dir(domain_name=domain_name, env_name=env_name, recognizer=recognizer),
-        "experiments",
+        get_env_outputs_dir(
+            domain_name=domain_name, env_name=env_name, recognizer=recognizer
+        ),
+        "confidence",
     )
 ### GRAQL PATHS ###
-def get_status_path(model_dir):
-    return os.path.join(model_dir, "status.pt")
-def get_status(model_dir):
-    path = get_status_path(model_dir)
-    return torch.load(path, map_location=device)
-def save_status(status, model_dir):
-    path = get_status_path(model_dir)
-    utils.create_folders_if_necessary(path)
-    torch.save(status, path)
-def get_vocab(model_dir):
-    return get_status(model_dir)["vocab"]
-def get_model_state(model_dir):
-    return get_status(model_dir)["model_state"]
-def get_txt_logger(model_dir):
-    path = os.path.join(model_dir, "log.txt")
-    utils.create_folders_if_necessary(path)
-    logging.basicConfig(
-        level=logging.INFO,
-        format="%(message)s",
-        handlers=[
-            logging.FileHandler(filename=path),
-            logging.StreamHandler(sys.stdout),
-        ],
-    )
-    return logging.getLogger()
-def get_csv_logger(model_dir):
-    csv_path = os.path.join(model_dir, "log.csv")
-    utils.create_folders_if_necessary(csv_path)
-    csv_file = open(csv_path, "a")
-    return csv_file, csv.writer(csv_file)

gr_libs/odgr_executor.py ADDED Viewed

@@ -0,0 +1,268 @@
+import argparse
+import os
+import time
+import dill
+from gr_libs.environment.utils.utils import domain_to_env_property
+from gr_libs.metrics.metrics import stochastic_amplified_selection
+from gr_libs.ml.neural.deep_rl_learner import DeepRLAgent
+from gr_libs.ml.utils.format import random_subset_with_order
+from gr_libs.ml.utils.storage import (
+    get_and_create,
+    get_experiment_results_path,
+    get_policy_sequences_result_path,
+)
+from gr_libs.problems.consts import PROBLEMS
+from gr_libs.recognizer.gr_as_rl.gr_as_rl_recognizer import Draco, GCDraco
+from gr_libs.recognizer.graml.graml_recognizer import Graml
+from gr_libs.recognizer.recognizer import GaAgentTrainerRecognizer, LearningRecognizer
+from gr_libs.recognizer.utils import recognizer_str_to_obj
+def validate(args, recognizer_type, task_inputs):
+    if "base" in task_inputs.keys():
+        # assert issubclass(recognizer_type, LearningRecognizer), f"base is in the task_inputs for the recognizer {args.recognizer}, which doesn't have a domain learning phase (is not a learning recognizer)."
+        assert (
+            list(task_inputs.keys())[0] == "base"
+        ), "In case of LearningRecognizer, base should be the first element in the task_inputs dict in consts.py"
+        assert (
+            "base" not in list(task_inputs.keys())[1:]
+        ), "In case of LearningRecognizer, base should be only in the first element in the task_inputs dict in consts.py"
+    # else:
+    # assert not issubclass(recognizer_type, LearningRecognizer), f"base is not in the task_inputs for the recognizer {args.recognizer}, which has a domain learning phase (is a learning recognizer). Remove it from the task_inputs dict in consts.py."
+def run_odgr_problem(args):
+    recognizer_type = recognizer_str_to_obj(args.recognizer)
+    env_inputs = PROBLEMS[args.domain]
+    assert (
+        args.env_name in env_inputs.keys()
+    ), f"env_name {args.env_name} is not in the list of available environments for the domain {args.domain}. Add it to PROBLEMS dict in consts.py"
+    task_inputs = env_inputs[args.env_name][args.task]
+    recognizer = recognizer_type(
+        domain_name=args.domain,
+        env_name=args.env_name,
+        collect_statistics=args.collect_stats,
+    )
+    validate(args, recognizer_type, task_inputs)
+    ga_times, results = [], {}
+    for key, value in task_inputs.items():
+        if key == "base":
+            dlp_time = 0
+            if issubclass(recognizer_type, LearningRecognizer):
+                start_dlp_time = time.time()
+                recognizer.domain_learning_phase(
+                    base_goals=value["goals"], train_configs=value["train_configs"]
+                )
+                dlp_time = time.time() - start_dlp_time
+        elif key.startswith("G_"):
+            start_ga_time = time.time()
+            kwargs = {"dynamic_goals": value["goals"]}
+            if issubclass(recognizer_type, GaAgentTrainerRecognizer):
+                kwargs["dynamic_train_configs"] = value["train_configs"]
+            recognizer.goals_adaptation_phase(**kwargs)
+            ga_times.append(time.time() - start_ga_time)
+        elif key.startswith("I_"):
+            goal, train_config, consecutive, consecutive_str, percentage = (
+                value["goal"],
+                value["train_config"],
+                value["consecutive"],
+                "consecutive" if value["consecutive"] == True else "non_consecutive",
+                value["percentage"],
+            )
+            results.setdefault(str(percentage), {})
+            results[str(percentage)].setdefault(
+                consecutive_str,
+                {
+                    "correct": 0,
+                    "num_of_tasks": 0,
+                    "accuracy": 0,
+                    "average_inference_time": 0,
+                },
+            )
+            property_type = domain_to_env_property(args.domain)
+            env_property = property_type(args.env_name)
+            problem_name = env_property.goal_to_problem_str(goal)
+            rl_agent_type = recognizer.rl_agent_type
+            agent = rl_agent_type(
+                domain_name=args.domain,
+                problem_name=problem_name,
+                algorithm=train_config[0],
+                num_timesteps=train_config[1],
+                env_prop=env_property,
+            )
+            agent.learn()
+            fig_path = get_and_create(
+                f"{os.path.abspath(os.path.join(get_policy_sequences_result_path(domain_name=args.domain, env_name=args.env_name, recognizer=args.recognizer), problem_name))}_inference_seq"
+            )
+            generate_obs_kwargs = {
+                "action_selection_method": stochastic_amplified_selection,
+                "save_fig": args.collect_stats,
+                "random_optimalism": True,
+                "fig_path": fig_path if args.collect_stats else None,
+            }
+            # need to dump the whole plan for draco because it needs it for inference phase for checking likelihood.
+            if (recognizer_type == Draco or recognizer_type == GCDraco) and issubclass(
+                rl_agent_type, DeepRLAgent
+            ):  # TODO remove this condition, remove the assumption.
+                generate_obs_kwargs["with_dict"] = True
+            sequence = agent.generate_observation(**generate_obs_kwargs)
+            if issubclass(
+                recognizer_type, Graml
+            ):  # need to dump the plans to compute offline plan similarity only in graml's case for evaluation.
+                recognizer.dump_plans(
+                    true_sequence=sequence, true_goal=goal, percentage=percentage
+                )
+            partial_sequence = random_subset_with_order(
+                sequence, (int)(percentage * len(sequence)), is_consecutive=consecutive
+            )
+            # add evaluation_function to kwargs if this is graql. move everything to kwargs...
+            start_inf_time = time.time()
+            closest_goal = recognizer.inference_phase(
+                partial_sequence, goal, percentage
+            )
+            results[str(percentage)][consecutive_str]["average_inference_time"] += (
+                time.time() - start_inf_time
+            )
+            # print(f'real goal {goal}, closest goal is: {closest_goal}')
+            if all(a == b for a, b in zip(str(goal), closest_goal)):
+                results[str(percentage)][consecutive_str]["correct"] += 1
+            results[str(percentage)][consecutive_str]["num_of_tasks"] += 1
+    for percentage in results.keys():
+        for consecutive_str in results[str(percentage)].keys():
+            results[str(percentage)][consecutive_str]["average_inference_time"] /= len(
+                results[str(percentage)][consecutive_str]
+            )
+            results[str(percentage)][consecutive_str]["accuracy"] = (
+                results[str(percentage)][consecutive_str]["correct"]
+                / results[str(percentage)][consecutive_str]["num_of_tasks"]
+            )
+    # aggregate
+    total_correct = sum(
+        [
+            result["correct"]
+            for cons_result in results.values()
+            for result in cons_result.values()
+        ]
+    )
+    total_tasks = sum(
+        [
+            result["num_of_tasks"]
+            for cons_result in results.values()
+            for result in cons_result.values()
+        ]
+    )
+    total_average_inference_time = (
+        sum(
+            [
+                result["average_inference_time"]
+                for cons_result in results.values()
+                for result in cons_result.values()
+            ]
+        )
+        / total_tasks
+    )
+    results["total"] = {
+        "total_correct": total_correct,
+        "total_tasks": total_tasks,
+        "total_accuracy": total_correct / total_tasks,
+        "total_average_inference_time": total_average_inference_time,
+        "goals_adaptation_time": sum(ga_times) / len(ga_times),
+        "domain_learning_time": dlp_time,
+    }
+    print(str(results))
+    res_file_path = get_and_create(
+        get_experiment_results_path(
+            domain=args.domain,
+            env_name=args.env_name,
+            task=args.task,
+            recognizer=args.recognizer,
+        )
+    )
+    print(f"generating results into {res_file_path}")
+    with open(os.path.join(res_file_path, "res.pkl"), "wb") as results_file:
+        dill.dump(results, results_file)
+    with open(os.path.join(res_file_path, "res.txt"), "w") as results_file:
+        results_file.write(str(results))
+def parse_args():
+    parser = argparse.ArgumentParser(
+        description="Parse command-line arguments for the RL experiment.",
+        formatter_class=argparse.RawTextHelpFormatter,
+    )
+    # Required arguments
+    required_group = parser.add_argument_group("Required arguments")
+    required_group.add_argument(
+        "--domain",
+        choices=["point_maze", "minigrid", "parking", "panda"],
+        required=True,
+        help="Domain name (point_maze, minigrid, parking, or panda)",
+    )
+    required_group.add_argument(
+        "--env_name",
+        required=True,
+        help="Env name (point_maze, minigrid, parking, or panda). For example, Parking-S-14-PC--v0",
+    )
+    required_group.add_argument(
+        "--recognizer",
+        choices=[
+            "MCTSBasedGraml",
+            "ExpertBasedGraml",
+            "GCGraml",
+            "Graql",
+            "Draco",
+            "GCDraco",
+        ],
+        required=True,
+        help="Recognizer type. Follow readme.md and recognizer folder for more information and rules.",
+    )
+    required_group.add_argument(
+        "--task",
+        choices=[
+            "L1",
+            "L2",
+            "L3",
+            "L4",
+            "L5",
+            "L11",
+            "L22",
+            "L33",
+            "L44",
+            "L55",
+            "L111",
+            "L222",
+            "L333",
+            "L444",
+            "L555",
+        ],
+        required=True,
+        help="Task identifier (e.g., L1, L2,...,L5)",
+    )
+    # Optional arguments
+    optional_group = parser.add_argument_group("Optional arguments")
+    optional_group.add_argument(
+        "--collect_stats", action="store_true", help="Whether to collect statistics"
+    )
+    args = parser.parse_args()
+    ### VALIDATE INPUTS ###
+    # Assert that all required arguments are provided
+    assert (
+        args.domain is not None
+        and args.recognizer is not None
+        and args.task is not None
+    ), "Missing required arguments: domain, recognizer, or task"
+    return args
+if __name__ == "__main__":
+    args = parse_args()
+    run_odgr_problem(args)

gr_libs/problems/consts.py CHANGED Viewed

@@ -1,15 +1,15 @@
 import numpy as np
 from stable_baselines3 import PPO, SAC, TD3
 from gr_libs.environment.environment import (
     MINIGRID,
-    PARKING,
     PANDA,
+    PARKING,
     POINT_MAZE,
     QLEARNING,
     PandaProperty,
 )
 PROBLEMS = {
     PARKING: {
         "Parking-S-14-PC-": {

gr_libs/recognizer/_utils/__init__.py ADDED Viewed

File without changes

gr_libs/recognizer/{utils → _utils}/format.py RENAMED Viewed

@@ -1,9 +1,9 @@
+from gr_libs.recognizer.gr_as_rl.gr_as_rl_recognizer import Draco, GCDraco, Graql
 from gr_libs.recognizer.graml.graml_recognizer import (
-    GCGraml,
     ExpertBasedGraml,
+    GCGraml,
     MCTSBasedGraml,
 )
-from gr_libs.recognizer.gr_as_rl.gr_as_rl_recognizer import Graql, Draco, GCDraco
 def recognizer_str_to_obj(recognizer_str: str):

gr-libs 0.1.8__py3-none-any.whl → 0.2.2__py3-none-any.whl

gr-libs 0.1.8py3-none-any.whl → 0.2.2py3-none-any.whl