PyPI - accelforge - Versions diffs - 0.0.1__py3-none-any.whl - Mend

accelforge 0.0.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (258) hide show

accelforge/__init__.py +21 -0
accelforge/_accelerated_imports.py +16 -0
accelforge/_deprecate/_simanneal/evalmapping.py +271 -0
accelforge/_deprecate/_simanneal/mapspaceglobals.py +298 -0
accelforge/_deprecate/_simanneal/simanneal.py +666 -0
accelforge/_deprecate/_simanneal/tracking.py +105 -0
accelforge/_deprecate/_simanneal/wrappers.py +218 -0
accelforge/_deprecate/_simanneal2/__init__.py +7 -0
accelforge/_deprecate/_simanneal2/simanneal.py +493 -0
accelforge/_deprecate/_simanneal2/tracking.py +116 -0
accelforge/_deprecate/compatibility_util.py +181 -0
accelforge/_deprecate/layerdeduplication/__init__.py +2 -0
accelforge/_deprecate/layerdeduplication/group_similar_einsums.py +160 -0
accelforge/_deprecate/layerdeduplication/grouped_einsums.py +84 -0
accelforge/_deprecate/mapping_filter_tags/__init__.py +2 -0
accelforge/_deprecate/mapping_filter_tags/ffmt.py +212 -0
accelforge/_deprecate/mapping_filter_tags/onesplit.py +24 -0
accelforge/_deprecate/mapping_filter_tags/util.py +24 -0
accelforge/_deprecate/tags.py +69 -0
accelforge/_deprecate/viz/__init__.py +0 -0
accelforge/_deprecate/viz/interactive.py +159 -0
accelforge/_deprecate/viz/reservationtree.py +307 -0
accelforge/_deprecate/viz/ski_slope.py +88 -0
accelforge/_version.py +15 -0
accelforge/examples.py +39 -0
accelforge/frontend/__init__.py +10 -0
accelforge/frontend/_binding.py +129 -0
accelforge/frontend/_workload_isl/__init__.py +2 -0
accelforge/frontend/_workload_isl/_isl.py +149 -0
accelforge/frontend/_workload_isl/_symbolic.py +141 -0
accelforge/frontend/arch copy.py +1544 -0
accelforge/frontend/arch.py +1642 -0
accelforge/frontend/config.py +63 -0
accelforge/frontend/mapper/__init__.py +5 -0
accelforge/frontend/mapper/ffm.py +126 -0
accelforge/frontend/mapper/mapper.py +7 -0
accelforge/frontend/mapper/metrics.py +30 -0
accelforge/frontend/mapping/__init__.py +1 -0
accelforge/frontend/mapping/mapping.py +1736 -0
accelforge/frontend/model.py +14 -0
accelforge/frontend/renames.py +150 -0
accelforge/frontend/spec copy.py +230 -0
accelforge/frontend/spec.py +301 -0
accelforge/frontend/variables.py +12 -0
accelforge/frontend/workload.py +952 -0
accelforge/mapper/FFM/__init__.py +9 -0
accelforge/mapper/FFM/_join_pmappings/__init__.py +0 -0
accelforge/mapper/FFM/_join_pmappings/compatibility.py +653 -0
accelforge/mapper/FFM/_join_pmappings/compress_pmappings.py +140 -0
accelforge/mapper/FFM/_join_pmappings/join_pmappings.py +703 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_dataframe.py +901 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_group.py +337 -0
accelforge/mapper/FFM/_make_pmappings/contraints/__init__.py +0 -0
accelforge/mapper/FFM/_make_pmappings/contraints/constraints.py +360 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_loops.py +373 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_pmapping_templates.py +463 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_reservations.py +95 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storage_order.py +382 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storages.py +155 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings.py +411 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_pmappings_from_templates.py +407 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_tile_shapes.py +1681 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/run_model.py +170 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/symbol_relations.py +174 -0
accelforge/mapper/FFM/_make_pmappings/pmapper_job.py +282 -0
accelforge/mapper/FFM/_pareto_df/df_convention.py +273 -0
accelforge/mapper/FFM/_pareto_df/pareto copy.py +836 -0
accelforge/mapper/FFM/_pareto_df/pareto.py +508 -0
accelforge/mapper/FFM/data.py +61 -0
accelforge/mapper/FFM/main copy.py +236 -0
accelforge/mapper/FFM/main.py +208 -0
accelforge/mapper/FFM/mappings.py +510 -0
accelforge/mapper/FFM/pmappings.py +310 -0
accelforge/mapper/__init__.py +4 -0
accelforge/mapper.py +0 -0
accelforge/model/__init__.py +1 -0
accelforge/model/_looptree/__init__.py +0 -0
accelforge/model/_looptree/accesses.py +335 -0
accelforge/model/_looptree/capacity/__init__.py +1 -0
accelforge/model/_looptree/capacity/aggregators.py +36 -0
accelforge/model/_looptree/capacity/capacity.py +47 -0
accelforge/model/_looptree/energy.py +150 -0
accelforge/model/_looptree/equivalent_ranks.py +29 -0
accelforge/model/_looptree/latency/__init__.py +1 -0
accelforge/model/_looptree/latency/latency.py +98 -0
accelforge/model/_looptree/latency/memory.py +120 -0
accelforge/model/_looptree/latency/processors.py +92 -0
accelforge/model/_looptree/mapping_utilities.py +71 -0
accelforge/model/_looptree/reuse/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/__init__.py +1 -0
accelforge/model/_looptree/reuse/isl/des.py +59 -0
accelforge/model/_looptree/reuse/isl/isl_functions.py +374 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/analyze_mapping.py +297 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/skews_from_mapping.py +236 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/tiling.py +685 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/types.py +188 -0
accelforge/model/_looptree/reuse/isl/spatial.py +260 -0
accelforge/model/_looptree/reuse/isl/temporal.py +182 -0
accelforge/model/_looptree/reuse/symbolic/__init__.py +1 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy 2.py +1346 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy.py +1408 -0
accelforge/model/_looptree/reuse/symbolic/symbolic.py +1396 -0
accelforge/model/_looptree/run.py +122 -0
accelforge/model/_looptree/types.py +26 -0
accelforge/model/_looptree/visualization/__init__.py +0 -0
accelforge/model/_looptree/visualization/occupancy.py +11 -0
accelforge/model/main.py +222 -0
accelforge/plotting/__init__.py +2 -0
accelforge/plotting/mappings.py +219 -0
accelforge/plotting/specs.py +57 -0
accelforge/util/__init__.py +4 -0
accelforge/util/_base_analysis_types.py +24 -0
accelforge/util/_basetypes.py +1089 -0
accelforge/util/_frozenset.py +36 -0
accelforge/util/_isl.py +29 -0
accelforge/util/_itertools.py +14 -0
accelforge/util/_mathfuncs.py +57 -0
accelforge/util/_parse_expressions.py +339 -0
accelforge/util/_picklecache.py +32 -0
accelforge/util/_setexpressions.py +268 -0
accelforge/util/_sympy/__init__.py +0 -0
accelforge/util/_sympy/broadcast_max.py +18 -0
accelforge/util/_visualization.py +112 -0
accelforge/util/_yaml.py +579 -0
accelforge/util/parallel.py +193 -0
accelforge-0.0.1.dist-info/METADATA +64 -0
accelforge-0.0.1.dist-info/RECORD +258 -0
accelforge-0.0.1.dist-info/WHEEL +5 -0
accelforge-0.0.1.dist-info/licenses/LICENSE +19 -0
accelforge-0.0.1.dist-info/top_level.txt +5 -0
docs/_build/html/_sources/fastfusion.frontend.mapper.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.frontend.rst.txt +70 -0
docs/_build/html/_sources/fastfusion.frontend.workload.rst.txt +21 -0
docs/_build/html/_sources/fastfusion.mapper.FFM.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.mapper.rst.txt +18 -0
docs/_build/html/_sources/fastfusion.rst.txt +20 -0
docs/_build/html/_sources/fastfusion.util.rst.txt +21 -0
docs/_build/html/_sources/index.rst.txt +87 -0
docs/_build/html/_sources/modules.rst.txt +7 -0
docs/_build/html/_sources/notes/citation.rst.txt +45 -0
docs/_build/html/_sources/notes/definitions.rst.txt +43 -0
docs/_build/html/_sources/notes/faqs.rst.txt +39 -0
docs/_build/html/_sources/notes/modeling/accelerator_energy_latency.rst.txt +72 -0
docs/_build/html/_sources/notes/modeling/component_energy_area.rst.txt +96 -0
docs/_build/html/_sources/notes/modeling/mapping.rst.txt +100 -0
docs/_build/html/_sources/notes/modeling.rst.txt +33 -0
docs/_build/html/_sources/notes/parsing/arithmetic_parsing.rst.txt +136 -0
docs/_build/html/_sources/notes/parsing/setexpressions.rst.txt +63 -0
docs/_build/html/_sources/notes/parsing/yaml_parsing.rst.txt +176 -0
docs/_build/html/_sources/notes/quickstart_and_installation.rst.txt +9 -0
docs/_build/html/_sources/notes/spec/architecture.rst.txt +133 -0
docs/_build/html/_sources/notes/spec/mapping.rst.txt +12 -0
docs/_build/html/_sources/notes/spec/workload.rst.txt +83 -0
docs/_build/html/_sources/notes/spec.rst.txt +36 -0
docs/source/_ext/include_attrs.py +213 -0
docs/source/_ext/include_docstring.py +364 -0
docs/source/_ext/include_functions.py +154 -0
docs/source/_ext/include_notebook.py +131 -0
docs/source/_ext/include_yaml.py +119 -0
docs/source/_ext/inherited_attributes.py +222 -0
docs/source/_ext/paths.py +4 -0
docs/source/conf.py +79 -0
examples/arches/compute_in_memory/_include.yaml +74 -0
examples/arches/compute_in_memory/_include_functions.py +229 -0
examples/arches/compute_in_memory/_load_spec.py +57 -0
examples/arches/compute_in_memory/components/c2c_multiplier.py +181 -0
examples/arches/compute_in_memory/components/dac_c2c_r2r.py +605 -0
examples/arches/compute_in_memory/components/misc.py +195 -0
examples/arches/compute_in_memory/components/util/bit_functions.py +51 -0
examples/arches/compute_in_memory/components/zero_comparator.py +92 -0
examples/arches/compute_in_memory/isaac.yaml +233 -0
examples/arches/compute_in_memory/memory_cells/ecram_demo.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_isaac_isca_2016.yaml +64 -0
examples/arches/compute_in_memory/memory_cells/rram_neurosim_default.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_raella_isca_2023.yaml +70 -0
examples/arches/compute_in_memory/memory_cells/rram_wan_nature_2022.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_colonnade_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_jia_jssc_2020.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_sinangil_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_wang_vlsi_2022.yaml +63 -0
examples/arches/compute_in_memory/wang_vlsi_2022.yaml +289 -0
examples/arches/eyeriss.yaml +68 -0
examples/arches/fanout_variations/at_glb.yaml +31 -0
examples/arches/fanout_variations/at_glb_with_fanout_node.yaml +34 -0
examples/arches/fanout_variations/at_mac.yaml +31 -0
examples/arches/fanout_variations/at_mac_with_constraints.yaml +38 -0
examples/arches/fanout_variations/at_mac_with_fanout_node.yaml +34 -0
examples/arches/nvdla.yaml +47 -0
examples/arches/simple.yaml +28 -0
examples/arches/tpu_v4i.yaml +67 -0
examples/mappings/unfused_matmuls_to_simple.yaml +33 -0
examples/misc/component_annotated.yaml +33 -0
examples/workloads/gpt3_6.7B.yaml +124 -0
examples/workloads/matmuls.yaml +20 -0
examples/workloads/mobilenet_28.yaml +81 -0
examples/workloads/mobilenet_various_separate.yaml +106 -0
examples/workloads/three_matmuls_annotated.yaml +59 -0
notebooks/.ipynb_checkpoints/fastfusion_arch_study_michael-checkpoint.ipynb +359 -0
notebooks/compute_in_memory/_scripts.py +339 -0
notebooks/compute_in_memory/isaac.guide.ipynb +270 -0
notebooks/compute_in_memory/wang_vlsi_2022.ipynb +602 -0
notebooks/paths.py +4 -0
notebooks/tutorials/.ipynb_checkpoints/1_FFM-checkpoint.ipynb +3110 -0
notebooks/tutorials/FFM.ipynb +3498 -0
notebooks/tutorials/_include.py +48 -0
notebooks/tutorials/component_energy_area.ipynb +363 -0
tests/Q_mapping.yaml +38 -0
tests/__init__.py +0 -0
tests/conv.mapping.yaml +27 -0
tests/conv.workload.yaml +13 -0
tests/conv_sym.mapping.yaml +43 -0
tests/copy.mapping.yaml +35 -0
tests/copy.workload.yaml +15 -0
tests/distribuffers/__init__.py +0 -0
tests/distribuffers/multicast/test_cases.yaml +482 -0
tests/distribuffers/spec/binding/valid_bindings.yaml +97 -0
tests/distribuffers/spec/distributed.yaml +100 -0
tests/distribuffers/spec/logical_arch.yaml +32 -0
tests/distribuffers/spec/physical_arch.yaml +69 -0
tests/distribuffers/test_binding.py +48 -0
tests/frontend/__init__.py +0 -0
tests/frontend/test_mapping_viz.py +52 -0
tests/mapper/__init__.py +0 -0
tests/mapper/configs/conv1d/conv1d.mapping.yaml +31 -0
tests/mapper/configs/conv1d/conv1d.workload.yaml +11 -0
tests/mapper/configs/two_conv1d/two_conv1d.expected.yaml +38 -0
tests/mapper/configs/two_conv1d/two_conv1d.mapping.yaml +54 -0
tests/mapper/configs/two_conv1d/two_conv1d.workload.yaml +19 -0
tests/mapper/test_mapping_to_isl.py +90 -0
tests/mapper/test_spatial_reuse_analysis.py +67 -0
tests/mapper/test_temporal_reuse_analysis.py +56 -0
tests/mapper/util.py +58 -0
tests/matmul.mapping.yaml +29 -0
tests/matmul.workload.yaml +12 -0
tests/matmul_spatial.mapping.yaml +44 -0
tests/mha.renames.yaml +65 -0
tests/mha.workload.yaml +67 -0
tests/mha.yaml +59 -0
tests/mha_full.workload.yaml +67 -0
tests/mobilenet.workload.yaml +35 -0
tests/mobilenet_long.workload.yaml +64 -0
tests/pmappingcache.py +24 -0
tests/processing_stage.arch.yaml +40 -0
tests/snowcat.arch.yaml +36 -0
tests/test_ffm_join_pmappings.py +106 -0
tests/test_ffm_make_pmappings.py +82 -0
tests/test_ffm_make_tile_shapes.py +49 -0
tests/test_mapper.py +100 -0
tests/test_model.py +37 -0
tests/test_plotting.py +72 -0
tests/test_processing_stage.py +46 -0
tests/test_symbolic_model.py +248 -0
tests/test_workload.py +141 -0

tests/test_ffm_make_tile_shapes.py ADDED Viewed

@@ -0,0 +1,49 @@
+import unittest
+from pathlib import Path
+import time
+from accelforge.frontend.spec import Spec, Mapping
+from accelforge.mapper.FFM._make_pmappings.contraints.constraints import (
+    MappingConstraints,
+)
+from accelforge.mapper.FFM._make_pmappings.pmapper_job import Job
+from accelforge.mapper.FFM._make_pmappings.make_pmappings import make_tile_shapes
+from accelforge.frontend.mapper.metrics import Metrics
+from accelforge.frontend import arch
+class TestTileShapeExploration(unittest.TestCase):
+    def test_pmapping(self):
+        PARENT_DIR = Path(__file__).parent
+        spec = Spec.from_yaml(
+            PARENT_DIR / "conv.workload.yaml", PARENT_DIR / "four_level.arch.yaml"
+        )
+        spec = spec.calculate_component_area_energy_latency_leak(area=False)
+        mapping = Mapping.from_yaml(PARENT_DIR / "conv_sym.mapping.yaml")
+        flattened_arch = spec._get_flattened_architecture()
+        memories_track_all = [
+            m.name for m in flattened_arch if isinstance(m, arch.Memory)
+        ]
+        memories_track_pmappings_only = []
+        job = Job(
+            mapping=mapping,
+            constraints=MappingConstraints(),
+            spec=spec,
+            metrics=Metrics.LATENCY,
+            job_id=0,
+            rank_variable_bounds={},
+            memories_track_all=memories_track_all,
+            memories_track_pmappings_only=memories_track_pmappings_only,
+        )
+        result, _ = make_tile_shapes(job)
+        data, n_total_pmappings = result
+        self.assertTrue("Total_latency" in data.columns)
+if __name__ == "__main__":
+    unittest.main()

tests/test_mapper.py ADDED Viewed

@@ -0,0 +1,100 @@
+import unittest
+from pathlib import Path
+from accelforge.frontend.spec import Spec
+from accelforge.mapper import Metrics
+from accelforge.mapper.FFM.main import map_workload_to_arch
+EXAMPLES_DIR = Path(__file__).parent.parent / "examples"
+M_SHAPE = 64
+KN_SHAPE = 64
+class ActionChecker(unittest.TestCase):
+    def _check_memory_actions_exist(self, spec, memory_names, result):
+        for einsum_name in spec.workload.einsum_names:
+            for memory_name in memory_names:
+                for memory_action in ["read", "write"]:
+                    self.assertTrue(
+                        f"{einsum_name}<SEP>action<SEP>{memory_name}<SEP>{memory_action}" in result.data.columns,
+                        f"{einsum_name}<SEP>action<SEP>{memory_name}<SEP>{memory_action} "
+                        f"not found in {result.data.columns}"
+                    )
+class TestMapper(ActionChecker, unittest.TestCase):
+    def test_one_matmul(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            jinja_parse_data={"N_EINSUMS": 1, "M": 64, "KN": 64},
+        )
+        result = map_workload_to_arch(spec)
+        self._check_memory_actions_exist(spec, ["MainMemory", "GlobalBuffer"], result)
+    def test_two_matmuls(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = map_workload_to_arch(spec)
+        self._check_memory_actions_exist(spec, ["MainMemory", "GlobalBuffer"], result)
+class TestFanout(ActionChecker):
+    FANOUT = 4
+    """Need to sync this with YAMLs somehow."""
+    def _run_with_arch(self, arch_fname: str, n_einsums=1):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "fanout_variations" / arch_fname,
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            jinja_parse_data={"N_EINSUMS": n_einsums, "M": 64, "KN": 64},
+        )
+        spec.mapper.ffm.metrics = Metrics.LATENCY
+        result = map_workload_to_arch(spec)
+        self._check_memory_actions_exist(spec, ["MainMemory", "GlobalBuffer"], result)
+        self.assertEqual(
+            result.data["Matmul0<SEP>Total<SEP>latency"].iloc[0],
+            M_SHAPE*KN_SHAPE**2/self.FANOUT
+        )
+        return result
+class TestMapperFanoutOneMatmul(TestFanout):
+    def test_at_mac(self):
+        self._run_with_arch("at_mac.yaml")
+    def test_at_glb(self):
+        self._run_with_arch("at_glb.yaml")
+    def test_at_mac_with_fanout_node(self):
+        self._run_with_arch("at_mac_with_fanout_node.yaml")
+    def test_at_glb_with_fanout_node(self):
+        self._run_with_arch("at_glb_with_fanout_node.yaml")
+class TestMapperFanoutTwoMatmuls(TestFanout):
+    def test_at_mac(self):
+        self._run_with_arch("at_mac.yaml", n_einsums=2)
+    def test_at_glb(self):
+        self._run_with_arch("at_glb.yaml", n_einsums=2)
+    def test_at_mac_with_fanout_node(self):
+        self._run_with_arch("at_mac_with_fanout_node.yaml", n_einsums=2)
+    def test_at_glb_with_fanout_node(self):
+        self._run_with_arch("at_glb_with_fanout_node.yaml", n_einsums=2)
+class TestMapperFanoutConstraints(TestFanout):
+    def test_at_mac_constraints(self):
+        self._run_with_arch("at_mac_with_constraints.yaml")

tests/test_model.py ADDED Viewed

@@ -0,0 +1,37 @@
+import unittest
+from pathlib import Path
+from accelforge.frontend.spec import Spec
+from accelforge.model.main import evaluate_mapping
+from accelforge.util.parallel import set_n_parallel_jobs
+set_n_parallel_jobs(1)
+EXAMPLES_DIR = Path(__file__).parent.parent / "examples"
+class TestModel(unittest.TestCase):
+    def test_one_matmul(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 1, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+    def test_two_matmuls(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+if __name__ == "__main__":
+    unittest.main()

tests/test_plotting.py ADDED Viewed

@@ -0,0 +1,72 @@
+import unittest
+from pathlib import Path
+from accelforge.frontend.spec import Spec
+from accelforge.model.main import evaluate_mapping
+from accelforge.util.parallel import set_n_parallel_jobs
+from accelforge.plotting.mappings import plot_energy_comparison, plot_energy_breakdown, plot_action_breakdown
+set_n_parallel_jobs(1)
+EXAMPLES_DIR = Path(__file__).parent.parent / "examples"
+class TestEnergyPlotting(unittest.TestCase):
+    def test_comparison(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+        fig, ax = plot_energy_comparison([result])
+        fig.tight_layout()
+        fig.savefig("total.png", dpi=400, bbox_inches="tight")
+    def test_breakdown(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+        fig, axes = plot_energy_breakdown([result, result], ["einsum", "component"])
+        fig.tight_layout()
+        fig.savefig("fig.png", dpi=400, bbox_inches="tight")
+    def test_breakdown_stacked(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+        fig, axes = plot_energy_breakdown([result, result], ["einsum", "component"], ["action"])
+        fig.tight_layout()
+        fig.savefig("fig.png", dpi=400, bbox_inches="tight")
+class TestActionPlotting(unittest.TestCase):
+    def test_breakdown(self):
+        spec = Spec.from_yaml(
+            EXAMPLES_DIR / "arches" / "simple.yaml",
+            EXAMPLES_DIR / "workloads" / "matmuls.yaml",
+            EXAMPLES_DIR / "mappings" / "unfused_matmuls_to_simple.yaml",
+            jinja_parse_data={"N_EINSUMS": 2, "M": 64, "KN": 64},
+        )
+        result = evaluate_mapping(spec)
+        fig, axes = plot_action_breakdown([result, result], ["einsum", "component"])
+        fig.tight_layout()
+        fig.savefig("fig.png", dpi=400, bbox_inches="tight")

tests/test_processing_stage.py ADDED Viewed

@@ -0,0 +1,46 @@
+from math import isclose
+import unittest
+from pathlib import Path
+from accelforge.frontend import Spec
+from accelforge.frontend.arch import Arch
+from accelforge.frontend.mapping import Mapping
+from accelforge.frontend.workload import Workload
+from accelforge.frontend.mapper.metrics import Metrics
+from accelforge.model._looptree.accesses import (
+    isl_buffer_accesses_from_buffet_actions,
+    Accesses,
+)
+from accelforge.model._looptree.energy import gather_actions
+from accelforge.model._looptree.latency import get_latency
+from accelforge.model._looptree.types import Buffet
+from accelforge.model._looptree.reuse.symbolic import (
+    BuffetStats,
+    analyze_reuse_and_add_reservations_to_mapping,
+    Compute,
+)
+from accelforge.mapper.FFM import make_pmappings, join_pmappings
+PARENT_DIR = Path(__file__).parent
+class TestProcessingStage(unittest.TestCase):
+    def test_processing_stage(self):
+        spec = Spec.from_yaml(
+            [
+                Path(__file__).parent / "processing_stage.arch.yaml",
+                Path(__file__).parent / "matmul.workload.yaml",
+            ]
+        )
+        spec.mapper.ffm.metrics = Metrics.ENERGY
+        pmappings = make_pmappings(spec)
+        mappings = join_pmappings(spec, pmappings)
+        energy = mappings.data.iloc[0]["Total_energy"]
+        self.assertAlmostEqual(energy, 100 * (128 * 64 * 2 + 128 * 128))
+if __name__ == "__main__":
+    unittest.main()

tests/test_symbolic_model.py ADDED Viewed

@@ -0,0 +1,248 @@
+from math import isclose
+import unittest
+from pathlib import Path
+from accelforge.frontend import Spec
+from accelforge.frontend.mapping import Mapping
+from accelforge.frontend.workload import Workload
+from accelforge.mapper.FFM._make_pmappings.pmapper_job import Job
+from accelforge.model._looptree.accesses import (
+    isl_buffer_accesses_from_buffet_actions,
+    Accesses,
+)
+from accelforge.model._looptree.energy import gather_actions
+from accelforge.model._looptree.latency import get_latency
+from accelforge.model._looptree.types import Buffet
+from accelforge.model._looptree.reuse.symbolic import (
+    BuffetStats,
+    analyze_reuse_and_add_reservations_to_mapping,
+    Compute,
+)
+PARENT_DIR = Path(__file__).parent
+def make_job(mapping: Mapping, workload: Workload) -> Job:
+    return Job(
+        spec=None,
+        mapping=mapping,
+        workload=workload,
+    )
+class TestSymbolicModel(unittest.TestCase):
+    def test_q_mapping(self):
+        mapping = Mapping.from_yaml(Path(__file__).parent / "Q_mapping.yaml")
+        workload = Workload.from_yaml(Path(__file__).parent / "mha.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("Q", "MAC")].total_ops, 64.0
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("Q", "MAC")].max_per_unit_ops, 16.0
+        )
+    def test_conv_mapping(self):
+        mapping = Mapping.from_yaml(Path(__file__).parent / "conv.mapping.yaml")
+        workload = Workload.from_yaml(Path(__file__).parent / "conv.workload.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("conv", "MAC")].total_ops, 120.0
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("conv", "MAC")].max_per_unit_ops, 10.0
+        )
+    def test_matmul_mapping(self):
+        mapping = Mapping.from_yaml(Path(__file__).parent / "matmul.mapping.yaml")
+        workload = Workload.from_yaml(Path(__file__).parent / "matmul.workload.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        REF_OCCUPANCY = {"W0": 1, "T0": 128, "T1": 128 * 128}
+        for tensor, ref_occupancy in REF_OCCUPANCY.items():
+            self.assertAlmostEqual(
+                result.buffet_stats[
+                    Buffet(tensor, "Matmul1", "LocalBuffer")
+                ].max_occupancy,
+                ref_occupancy,
+            )
+    def test_matmul_spatial(self):
+        mapping = Mapping.from_yaml(PARENT_DIR / "matmul_spatial.mapping.yaml")
+        workload = Workload.from_yaml(PARENT_DIR / "matmul.workload.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        self.assertAlmostEqual(
+            result.fanout,
+            {
+                ("LocalBuffer", "Matmul1"): {0: 128.0, 1: 4.0},
+                ("MainMemory", "Matmul1"): {},
+            },
+        )
+    def test_copy_mapping(self):
+        mapping = Mapping.from_yaml(PARENT_DIR / "copy.mapping.yaml")
+        workload = Workload.from_yaml(PARENT_DIR / "copy.workload.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("copy", "MAC")].total_ops, 0
+        )
+        self.assertAlmostEqual(
+            result.compute_stats[Compute("copy", "MAC")].max_per_unit_ops, 0
+        )
+        for tensor in ["O1", "O2", "O3", "O4"]:
+            for memory in [
+                "MainMemory",
+                "GlobalBuffer",
+                "LocalBuffer",
+                "Register",
+                "MAC",
+            ]:
+                buffet = Buffet(level=memory, tensor=tensor, einsum="copy")
+                if buffet not in result.buffet_stats:
+                    continue
+                stats = result.buffet_stats[buffet]
+                self.assertAlmostEqual(stats.net_total_read_actions(), 0)
+                self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 0)
+                self.assertAlmostEqual(stats.net_total_write_actions(), 0)
+                self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 0)
+                self.assertAlmostEqual(stats.max_occupancy, 0)
+        buffet = Buffet(level="GlobalBuffer", tensor="I", einsum="copy")
+        stats = result.buffet_stats.get(buffet, BuffetStats())
+        self.assertAlmostEqual(stats.net_total_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 0)
+        self.assertAlmostEqual(stats.max_occupancy, 0)
+        stats = result.buffet_stats[
+            Buffet(level="LocalBuffer", tensor="I", einsum="copy")
+        ]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 16)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 16)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 0)
+        self.assertAlmostEqual(stats.max_occupancy, 2)
+        stats = result.buffet_stats[Buffet(level="Register", tensor="I", einsum="copy")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 8)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 8)
+        self.assertAlmostEqual(stats.max_occupancy, 1)
+        stats = result.buffet_stats[
+            Buffet(level="MainMemory", tensor="I", einsum="copy")
+        ]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 8)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 8)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 8)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 8)
+        self.assertAlmostEqual(stats.max_occupancy, 8)
+        stats = result.buffet_stats[Buffet(level="Disk", tensor="I", einsum="copy")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 8)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 8)
+        self.assertAlmostEqual(stats.max_occupancy, 8)
+class TestSymbolicAccesses(unittest.TestCase):
+    def test_q_mapping(self):
+        mapping = Mapping.from_yaml(Path(__file__).parent / "Q_mapping.yaml")
+        workload = Workload.from_yaml(Path(__file__).parent / "mha.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        # main_memory_I_accesses = accesses.get_accesses('MainMemory', 'I', 'Q')
+        stats = result.buffet_stats[Buffet(level="MainMemory", tensor="I", einsum="Q")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 0.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 0.0)
+        stats = result.buffet_stats[Buffet(level="LocalBuffer", tensor="I", einsum="Q")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 16.0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 16.0)
+        stats = result.buffet_stats[Buffet(level="MainMemory", tensor="Q", einsum="Q")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 16.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 16.0)
+        stats = result.buffet_stats[Buffet(level="LocalBuffer", tensor="Q", einsum="Q")]
+        self.assertAlmostEqual(stats.net_total_read_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_read_actions(), 16.0)
+        self.assertAlmostEqual(stats.net_total_write_actions(), 64.0)
+        self.assertAlmostEqual(stats.net_max_per_unit_write_actions(), 16.0)
+class TestSymbolicActions(unittest.TestCase):
+    def test_q_mapping(self):
+        mapping = Mapping.from_yaml(Path(__file__).parent / "Q_mapping.yaml")
+        workload = Workload.from_yaml(Path(__file__).parent / "mha.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        actions = gather_actions(result, None, use_name=True)
+        self.assertAlmostEqual(actions[("LocalBuffer", "read")].total, 128.0)
+        self.assertAlmostEqual(actions[("LocalBuffer", "read")].max_per_unit, 32.0)
+        self.assertAlmostEqual(actions[("LocalBuffer", "write")].total, 128.0)
+        self.assertAlmostEqual(actions[("LocalBuffer", "write")].max_per_unit, 32.0)
+        self.assertAlmostEqual(actions[("MAC", "compute")].total, 64.0)
+        self.assertAlmostEqual(actions[("MAC", "compute")].max_per_unit, 16.0)
+class TestSymbolicLatency(unittest.TestCase):
+    def test_q_mapping(self):
+        spec = Spec.from_yaml(
+            [
+                # Path(__file__).parent / 'Q_mapping.yaml',
+                Path(__file__).parent / "mha.yaml",
+                Path(__file__).parent / "four_level.arch.yaml",
+            ]
+        )
+        workload = spec.workload
+        architecture = spec._get_flattened_architecture()
+        mapping = Mapping.from_yaml(Path(__file__).parent / "Q_mapping.yaml")
+        result = analyze_reuse_and_add_reservations_to_mapping(
+            make_job(mapping, workload)
+        )
+        overall_latency, _, _ = get_latency(result, mapping, workload, architecture)
+        self.assertAlmostEqual(overall_latency, 16.0)
+if __name__ == "__main__":
+    unittest.main()