PyPI - pyg-nightly - Versions diffs - 2.6.0.dev20240318__py3-none-any.whl → 2.7.0.dev20250115__py3-none-any.whl - Mend

pyg-nightly 2.6.0.dev20240318py3-none-any.whl → 2.7.0.dev20250115py3-none-any.whl

Files changed (226) hide show

{pyg_nightly-2.6.0.dev20240318.dist-info → pyg_nightly-2.7.0.dev20250115.dist-info}/METADATA +31 -47
{pyg_nightly-2.6.0.dev20240318.dist-info → pyg_nightly-2.7.0.dev20250115.dist-info}/RECORD +226 -199
{pyg_nightly-2.6.0.dev20240318.dist-info → pyg_nightly-2.7.0.dev20250115.dist-info}/WHEEL +1 -1
torch_geometric/__init__.py +28 -1
torch_geometric/_compile.py +8 -1
torch_geometric/_onnx.py +14 -0
torch_geometric/config_mixin.py +113 -0
torch_geometric/config_store.py +28 -19
torch_geometric/data/__init__.py +24 -1
torch_geometric/data/batch.py +2 -2
torch_geometric/data/collate.py +8 -2
torch_geometric/data/data.py +16 -8
torch_geometric/data/database.py +61 -15
torch_geometric/data/dataset.py +14 -6
torch_geometric/data/feature_store.py +25 -42
torch_geometric/data/graph_store.py +1 -5
torch_geometric/data/hetero_data.py +18 -9
torch_geometric/data/in_memory_dataset.py +2 -4
torch_geometric/data/large_graph_indexer.py +677 -0
torch_geometric/data/lightning/datamodule.py +4 -4
torch_geometric/data/separate.py +6 -1
torch_geometric/data/storage.py +17 -7
torch_geometric/data/summary.py +14 -4
torch_geometric/data/temporal.py +1 -2
torch_geometric/datasets/__init__.py +17 -2
torch_geometric/datasets/actor.py +9 -11
torch_geometric/datasets/airfrans.py +15 -18
torch_geometric/datasets/airports.py +10 -12
torch_geometric/datasets/amazon.py +8 -11
torch_geometric/datasets/amazon_book.py +9 -10
torch_geometric/datasets/amazon_products.py +9 -10
torch_geometric/datasets/aminer.py +8 -9
torch_geometric/datasets/aqsol.py +10 -13
torch_geometric/datasets/attributed_graph_dataset.py +10 -12
torch_geometric/datasets/ba_multi_shapes.py +10 -12
torch_geometric/datasets/ba_shapes.py +5 -6
torch_geometric/datasets/bitcoin_otc.py +1 -1
torch_geometric/datasets/brca_tgca.py +1 -1
torch_geometric/datasets/cornell.py +145 -0
torch_geometric/datasets/dblp.py +2 -1
torch_geometric/datasets/dbp15k.py +2 -2
torch_geometric/datasets/fake.py +1 -3
torch_geometric/datasets/flickr.py +2 -1
torch_geometric/datasets/freebase.py +1 -1
torch_geometric/datasets/gdelt_lite.py +3 -2
torch_geometric/datasets/ged_dataset.py +3 -2
torch_geometric/datasets/git_mol_dataset.py +263 -0
torch_geometric/datasets/gnn_benchmark_dataset.py +11 -10
torch_geometric/datasets/hgb_dataset.py +8 -8
torch_geometric/datasets/imdb.py +2 -1
torch_geometric/datasets/karate.py +3 -2
torch_geometric/datasets/last_fm.py +2 -1
torch_geometric/datasets/linkx_dataset.py +4 -3
torch_geometric/datasets/lrgb.py +3 -5
torch_geometric/datasets/malnet_tiny.py +4 -3
torch_geometric/datasets/mnist_superpixels.py +2 -3
torch_geometric/datasets/molecule_gpt_dataset.py +485 -0
torch_geometric/datasets/molecule_net.py +15 -3
torch_geometric/datasets/motif_generator/base.py +0 -1
torch_geometric/datasets/neurograph.py +1 -3
torch_geometric/datasets/ogb_mag.py +1 -1
torch_geometric/datasets/opf.py +239 -0
torch_geometric/datasets/ose_gvcs.py +1 -1
torch_geometric/datasets/pascal.py +11 -9
torch_geometric/datasets/pascal_pf.py +1 -1
torch_geometric/datasets/pcpnet_dataset.py +1 -1
torch_geometric/datasets/pcqm4m.py +10 -3
torch_geometric/datasets/ppi.py +1 -1
torch_geometric/datasets/qm9.py +8 -7
torch_geometric/datasets/rcdd.py +4 -4
torch_geometric/datasets/reddit.py +2 -1
torch_geometric/datasets/reddit2.py +2 -1
torch_geometric/datasets/rel_link_pred_dataset.py +3 -3
torch_geometric/datasets/s3dis.py +5 -3
torch_geometric/datasets/shapenet.py +3 -3
torch_geometric/datasets/shrec2016.py +2 -2
torch_geometric/datasets/snap_dataset.py +7 -1
torch_geometric/datasets/tag_dataset.py +350 -0
torch_geometric/datasets/upfd.py +2 -1
torch_geometric/datasets/web_qsp_dataset.py +246 -0
torch_geometric/datasets/webkb.py +2 -2
torch_geometric/datasets/wikics.py +1 -1
torch_geometric/datasets/wikidata.py +3 -2
torch_geometric/datasets/wikipedia_network.py +2 -2
torch_geometric/datasets/willow_object_class.py +1 -1
torch_geometric/datasets/word_net.py +2 -2
torch_geometric/datasets/yelp.py +2 -1
torch_geometric/datasets/zinc.py +1 -1
torch_geometric/device.py +42 -0
torch_geometric/distributed/local_feature_store.py +3 -2
torch_geometric/distributed/local_graph_store.py +2 -1
torch_geometric/distributed/partition.py +9 -8
torch_geometric/edge_index.py +616 -438
torch_geometric/explain/algorithm/base.py +0 -1
torch_geometric/explain/algorithm/graphmask_explainer.py +1 -2
torch_geometric/explain/algorithm/pg_explainer.py +1 -1
torch_geometric/explain/explanation.py +2 -2
torch_geometric/graphgym/checkpoint.py +2 -1
torch_geometric/graphgym/logger.py +4 -4
torch_geometric/graphgym/loss.py +1 -1
torch_geometric/graphgym/utils/agg_runs.py +6 -6
torch_geometric/index.py +826 -0
torch_geometric/inspector.py +13 -7
torch_geometric/io/fs.py +28 -2
torch_geometric/io/npz.py +2 -1
torch_geometric/io/off.py +2 -2
torch_geometric/io/sdf.py +2 -2
torch_geometric/io/tu.py +4 -5
torch_geometric/loader/__init__.py +4 -0
torch_geometric/loader/cluster.py +10 -4
torch_geometric/loader/graph_saint.py +2 -1
torch_geometric/loader/ibmb_loader.py +12 -4
torch_geometric/loader/mixin.py +1 -1
torch_geometric/loader/neighbor_loader.py +1 -1
torch_geometric/loader/neighbor_sampler.py +2 -2
torch_geometric/loader/prefetch.py +1 -1
torch_geometric/loader/rag_loader.py +107 -0
torch_geometric/loader/utils.py +8 -7
torch_geometric/loader/zip_loader.py +10 -0
torch_geometric/metrics/__init__.py +11 -2
torch_geometric/metrics/link_pred.py +317 -65
torch_geometric/nn/aggr/__init__.py +4 -0
torch_geometric/nn/aggr/attention.py +0 -2
torch_geometric/nn/aggr/base.py +3 -5
torch_geometric/nn/aggr/patch_transformer.py +143 -0
torch_geometric/nn/aggr/set_transformer.py +1 -1
torch_geometric/nn/aggr/variance_preserving.py +33 -0
torch_geometric/nn/attention/__init__.py +5 -1
torch_geometric/nn/attention/qformer.py +71 -0
torch_geometric/nn/conv/collect.jinja +7 -4
torch_geometric/nn/conv/cugraph/base.py +8 -12
torch_geometric/nn/conv/edge_conv.py +3 -2
torch_geometric/nn/conv/fused_gat_conv.py +1 -1
torch_geometric/nn/conv/gat_conv.py +35 -7
torch_geometric/nn/conv/gatv2_conv.py +36 -6
torch_geometric/nn/conv/general_conv.py +1 -1
torch_geometric/nn/conv/graph_conv.py +21 -3
torch_geometric/nn/conv/gravnet_conv.py +3 -2
torch_geometric/nn/conv/hetero_conv.py +3 -3
torch_geometric/nn/conv/hgt_conv.py +1 -1
torch_geometric/nn/conv/message_passing.py +138 -87
torch_geometric/nn/conv/mixhop_conv.py +1 -1
torch_geometric/nn/conv/propagate.jinja +9 -1
torch_geometric/nn/conv/rgcn_conv.py +5 -5
torch_geometric/nn/conv/spline_conv.py +4 -4
torch_geometric/nn/conv/x_conv.py +3 -2
torch_geometric/nn/dense/linear.py +11 -6
torch_geometric/nn/fx.py +3 -3
torch_geometric/nn/model_hub.py +3 -1
torch_geometric/nn/models/__init__.py +10 -2
torch_geometric/nn/models/deep_graph_infomax.py +1 -2
torch_geometric/nn/models/dimenet_utils.py +5 -7
torch_geometric/nn/models/g_retriever.py +230 -0
torch_geometric/nn/models/git_mol.py +336 -0
torch_geometric/nn/models/glem.py +385 -0
torch_geometric/nn/models/gnnff.py +0 -1
torch_geometric/nn/models/graph_unet.py +12 -3
torch_geometric/nn/models/jumping_knowledge.py +63 -4
torch_geometric/nn/models/lightgcn.py +1 -1
torch_geometric/nn/models/metapath2vec.py +5 -5
torch_geometric/nn/models/molecule_gpt.py +222 -0
torch_geometric/nn/models/node2vec.py +2 -3
torch_geometric/nn/models/schnet.py +2 -1
torch_geometric/nn/models/signed_gcn.py +3 -3
torch_geometric/nn/module_dict.py +2 -2
torch_geometric/nn/nlp/__init__.py +9 -0
torch_geometric/nn/nlp/llm.py +329 -0
torch_geometric/nn/nlp/sentence_transformer.py +134 -0
torch_geometric/nn/nlp/vision_transformer.py +33 -0
torch_geometric/nn/norm/batch_norm.py +1 -1
torch_geometric/nn/parameter_dict.py +2 -2
torch_geometric/nn/pool/__init__.py +21 -5
torch_geometric/nn/pool/cluster_pool.py +145 -0
torch_geometric/nn/pool/connect/base.py +0 -1
torch_geometric/nn/pool/edge_pool.py +1 -1
torch_geometric/nn/pool/graclus.py +4 -2
torch_geometric/nn/pool/pool.py +8 -2
torch_geometric/nn/pool/select/base.py +0 -1
torch_geometric/nn/pool/voxel_grid.py +3 -2
torch_geometric/nn/resolver.py +1 -1
torch_geometric/nn/sequential.jinja +10 -23
torch_geometric/nn/sequential.py +204 -78
torch_geometric/nn/summary.py +1 -1
torch_geometric/nn/to_hetero_with_bases_transformer.py +19 -19
torch_geometric/profile/__init__.py +2 -0
torch_geometric/profile/nvtx.py +66 -0
torch_geometric/profile/profiler.py +30 -19
torch_geometric/resolver.py +1 -1
torch_geometric/sampler/base.py +34 -13
torch_geometric/sampler/neighbor_sampler.py +11 -10
torch_geometric/sampler/utils.py +1 -1
torch_geometric/template.py +1 -0
torch_geometric/testing/__init__.py +6 -2
torch_geometric/testing/decorators.py +56 -22
torch_geometric/testing/feature_store.py +1 -1
torch_geometric/transforms/__init__.py +2 -0
torch_geometric/transforms/add_metapaths.py +5 -5
torch_geometric/transforms/add_positional_encoding.py +1 -1
torch_geometric/transforms/delaunay.py +65 -14
torch_geometric/transforms/face_to_edge.py +32 -3
torch_geometric/transforms/gdc.py +7 -6
torch_geometric/transforms/laplacian_lambda_max.py +3 -3
torch_geometric/transforms/mask.py +5 -1
torch_geometric/transforms/node_property_split.py +1 -2
torch_geometric/transforms/pad.py +7 -6
torch_geometric/transforms/random_link_split.py +1 -1
torch_geometric/transforms/remove_self_loops.py +36 -0
torch_geometric/transforms/svd_feature_reduction.py +1 -1
torch_geometric/transforms/to_sparse_tensor.py +1 -1
torch_geometric/transforms/two_hop.py +1 -1
torch_geometric/transforms/virtual_node.py +2 -1
torch_geometric/typing.py +43 -6
torch_geometric/utils/__init__.py +5 -1
torch_geometric/utils/_negative_sampling.py +1 -1
torch_geometric/utils/_normalize_edge_index.py +46 -0
torch_geometric/utils/_scatter.py +38 -12
torch_geometric/utils/_subgraph.py +4 -0
torch_geometric/utils/_tree_decomposition.py +2 -2
torch_geometric/utils/augmentation.py +1 -1
torch_geometric/utils/convert.py +12 -8
torch_geometric/utils/geodesic.py +24 -22
torch_geometric/utils/hetero.py +1 -1
torch_geometric/utils/map.py +8 -2
torch_geometric/utils/smiles.py +65 -27
torch_geometric/utils/sparse.py +39 -25
torch_geometric/visualization/graph.py +3 -4

torch_geometric/datasets/opf.py ADDED Viewed

@@ -0,0 +1,239 @@
+import json
+import os
+import os.path as osp
+from typing import Callable, Dict, List, Literal, Optional
+import torch
+import tqdm
+from torch import Tensor
+from torch_geometric.data import (
+    HeteroData,
+    InMemoryDataset,
+    download_url,
+    extract_tar,
+)
+class OPFDataset(InMemoryDataset):
+    r"""The heterogeneous OPF data from the `"Large-scale Datasets for AC
+    Optimal Power Flow with Topological Perturbations"
+    <https://arxiv.org/abs/2406.07234>`_ paper.
+    :class:`OPFDataset` is a large-scale dataset of solved optimal power flow
+    problems, derived from the
+    `pglib-opf <https://github.com/power-grid-lib/pglib-opf>`_ dataset.
+    The physical topology of the grid is represented by the :obj:`"bus"` node
+    type, and the connecting AC lines and transformers. Additionally,
+    :obj:`"generator"`, :obj:`"load"`, and :obj:`"shunt"` nodes are connected
+    to :obj:`"bus"` nodes using a dedicated edge type each, *e.g.*,
+    :obj:`"generator_link"`.
+    Edge direction corresponds to the properties of the line, *e.g.*,
+    :obj:`b_fr` is the line charging susceptance at the :obj:`from`
+    (source/sender) bus.
+    Args:
+        root (str): Root directory where the dataset should be saved.
+        split (str, optional): If :obj:`"train"`, loads the training dataset.
+            If :obj:`"val"`, loads the validation dataset.
+            If :obj:`"test"`, loads the test dataset. (default: :obj:`"train"`)
+        case_name (str, optional): The name of the original pglib-opf case.
+            (default: :obj:`"pglib_opf_case14_ieee"`)
+        num_groups (int, optional): The dataset is divided into 20 groups with
+            each group containing 15,000 samples.
+            For large networks, this amount of data can be overwhelming.
+            The :obj:`num_groups` parameters controls the amount of data being
+            downloaded. Allowed values are :obj:`[1, 20]`.
+            (default: :obj:`20`)
+        topological_perturbations (bool, optional): Whether to use the dataset
+            with added topological perturbations. (default: :obj:`False`)
+        transform (callable, optional): A function/transform that takes in
+            a :obj:`torch_geometric.data.HeteroData` object and returns a
+            transformed version. The data object will be transformed before
+            every access. (default: :obj:`None`)
+        pre_transform (callable, optional): A function/transform that takes
+            in a :obj:`torch_geometric.data.HeteroData` object and returns
+            a transformed version. The data object will be transformed before
+            being saved to disk. (default: :obj:`None`)
+        pre_filter (callable, optional): A function that takes in a
+            :obj:`torch_geometric.data.HeteroData` object and returns a boolean
+            value, indicating whether the data object should be included in the
+            final dataset. (default: :obj:`None`)
+        force_reload (bool, optional): Whether to re-process the dataset.
+            (default: :obj:`False`)
+    """
+    url = 'https://storage.googleapis.com/gridopt-dataset'
+    def __init__(
+        self,
+        root: str,
+        split: Literal['train', 'val', 'test'] = 'train',
+        case_name: Literal[
+            'pglib_opf_case14_ieee',
+            'pglib_opf_case30_ieee',
+            'pglib_opf_case57_ieee',
+            'pglib_opf_case118_ieee',
+            'pglib_opf_case500_goc',
+            'pglib_opf_case2000_goc',
+            'pglib_opf_case6470_rte',
+            'pglib_opf_case4661_sdet'
+            'pglib_opf_case10000_goc',
+            'pglib_opf_case13659_pegase',
+        ] = 'pglib_opf_case14_ieee',
+        num_groups: int = 20,
+        topological_perturbations: bool = False,
+        transform: Optional[Callable] = None,
+        pre_transform: Optional[Callable] = None,
+        pre_filter: Optional[Callable] = None,
+        force_reload: bool = False,
+    ) -> None:
+        self.split = split
+        self.case_name = case_name
+        self.num_groups = num_groups
+        self.topological_perturbations = topological_perturbations
+        self._release = 'dataset_release_1'
+        if topological_perturbations:
+            self._release += '_nminusone'
+        super().__init__(root, transform, pre_transform, pre_filter,
+                         force_reload=force_reload)
+        idx = self.processed_file_names.index(f'{split}.pt')
+        self.load(self.processed_paths[idx])
+    @property
+    def raw_dir(self) -> str:
+        return osp.join(self.root, self._release, self.case_name, 'raw')
+    @property
+    def processed_dir(self) -> str:
+        return osp.join(self.root, self._release, self.case_name,
+                        f'processed_{self.num_groups}')
+    @property
+    def raw_file_names(self) -> List[str]:
+        return [f'{self.case_name}_{i}.tar.gz' for i in range(self.num_groups)]
+    @property
+    def processed_file_names(self) -> List[str]:
+        return ['train.pt', 'val.pt', 'test.pt']
+    def download(self) -> None:
+        for name in self.raw_file_names:
+            url = f'{self.url}/{self._release}/{name}'
+            path = download_url(url, self.raw_dir)
+            extract_tar(path, self.raw_dir)
+    def process(self) -> None:
+        train_data_list = []
+        val_data_list = []
+        test_data_list = []
+        for group in tqdm.tqdm(range(self.num_groups)):
+            tmp_dir = osp.join(
+                self.raw_dir,
+                'gridopt-dataset-tmp',
+                self._release,
+                self.case_name,
+                f'group_{group}',
+            )
+            for name in os.listdir(tmp_dir):
+                with open(osp.join(tmp_dir, name)) as f:
+                    obj = json.load(f)
+                grid = obj['grid']
+                solution = obj['solution']
+                metadata = obj['metadata']
+                # Graph-level properties:
+                data = HeteroData()
+                data.x = torch.tensor(grid['context']).view(-1)
+                data.objective = torch.tensor(metadata['objective'])
+                # Nodes (only some have a target):
+                data['bus'].x = torch.tensor(grid['nodes']['bus'])
+                data['bus'].y = torch.tensor(solution['nodes']['bus'])
+                data['generator'].x = torch.tensor(grid['nodes']['generator'])
+                data['generator'].y = torch.tensor(
+                    solution['nodes']['generator'])
+                data['load'].x = torch.tensor(grid['nodes']['load'])
+                data['shunt'].x = torch.tensor(grid['nodes']['shunt'])
+                # Edges (only ac lines and transformers have features):
+                data['bus', 'ac_line', 'bus'].edge_index = (  #
+                    extract_edge_index(obj, 'ac_line'))
+                data['bus', 'ac_line', 'bus'].edge_attr = torch.tensor(
+                    grid['edges']['ac_line']['features'])
+                data['bus', 'ac_line', 'bus'].edge_label = torch.tensor(
+                    solution['edges']['ac_line']['features'])
+                data['bus', 'transformer', 'bus'].edge_index = (  #
+                    extract_edge_index(obj, 'transformer'))
+                data['bus', 'transformer', 'bus'].edge_attr = torch.tensor(
+                    grid['edges']['transformer']['features'])
+                data['bus', 'transformer', 'bus'].edge_label = torch.tensor(
+                    solution['edges']['transformer']['features'])
+                data['generator', 'generator_link', 'bus'].edge_index = (  #
+                    extract_edge_index(obj, 'generator_link'))
+                data['bus', 'generator_link', 'generator'].edge_index = (  #
+                    extract_edge_index_rev(obj, 'generator_link'))
+                data['load', 'load_link', 'bus'].edge_index = (  #
+                    extract_edge_index(obj, 'load_link'))
+                data['bus', 'load_link', 'load'].edge_index = (  #
+                    extract_edge_index_rev(obj, 'load_link'))
+                data['shunt', 'shunt_link', 'bus'].edge_index = (  #
+                    extract_edge_index(obj, 'shunt_link'))
+                data['bus', 'shunt_link', 'shunt'].edge_index = (  #
+                    extract_edge_index_rev(obj, 'shunt_link'))
+                if self.pre_filter is not None and not self.pre_filter(data):
+                    continue
+                if self.pre_transform is not None:
+                    data = self.pre_transform(data)
+                i = int(name.split('.')[0].split('_')[1])
+                train_limit = int(15_000 * self.num_groups * 0.9)
+                val_limit = train_limit + int(15_000 * self.num_groups * 0.05)
+                if i < train_limit:
+                    train_data_list.append(data)
+                elif i < val_limit:
+                    val_data_list.append(data)
+                else:
+                    test_data_list.append(data)
+        self.save(train_data_list, self.processed_paths[0])
+        self.save(val_data_list, self.processed_paths[1])
+        self.save(test_data_list, self.processed_paths[2])
+    def __repr__(self) -> str:
+        return (f'{self.__class__.__name__}({len(self)}, '
+                f'split={self.split}, '
+                f'case_name={self.case_name}, '
+                f'topological_perturbations={self.topological_perturbations})')
+def extract_edge_index(obj: Dict, edge_name: str) -> Tensor:
+    return torch.tensor([
+        obj['grid']['edges'][edge_name]['senders'],
+        obj['grid']['edges'][edge_name]['receivers'],
+    ])
+def extract_edge_index_rev(obj: Dict, edge_name: str) -> Tensor:
+    return torch.tensor([
+        obj['grid']['edges'][edge_name]['receivers'],
+        obj['grid']['edges'][edge_name]['senders'],
+    ])

torch_geometric/datasets/ose_gvcs.py CHANGED Viewed

@@ -97,7 +97,7 @@ class OSE_GVCS(InMemoryDataset):
         edges = defaultdict(list)
         for path in self.raw_paths:
-            with open(path, 'r') as f:
+            with open(path) as f:
                 product = json.load(f)
             categories.append(self.categories.index(product['category']))
             for interaction in product['ecology']:

torch_geometric/datasets/pascal.py CHANGED Viewed

@@ -192,19 +192,19 @@ class PascalVOCKeypoints(InMemoryDataset):
             child = obj.getElementsByTagName('xmin')[0].firstChild
             assert child is not None
-            xmin: float = float(child.data)  # type: ignore
+            xmin = int(child.data)  # type: ignore
             child = obj.getElementsByTagName('xmax')[0].firstChild
             assert child is not None
-            xmax = float(child.data)  # type: ignore
+            xmax = int(child.data)  # type: ignore
             child = obj.getElementsByTagName('ymin')[0].firstChild
             assert child is not None
-            ymin = float(child.data)  # type: ignore
+            ymin = int(child.data)  # type: ignore
             child = obj.getElementsByTagName('ymax')[0].firstChild
             assert child is not None
-            ymax = float(child.data)  # type: ignore
+            ymax = int(child.data)  # type: ignore
             box = (xmin, ymin, xmax, ymax)
@@ -227,10 +227,12 @@ class PascalVOCKeypoints(InMemoryDataset):
             # Add a small offset to the bounding because some keypoints lay
             # outside the bounding box intervals.
-            box = (min(float(pos[:, 0].min().floor()), box[0]) - 16,
-                   min(float(pos[:, 1].min().floor()), box[1]) - 16,
-                   max(float(pos[:, 0].max().ceil()), box[2]) + 16,
-                   max(float(pos[:, 1].max().ceil()), box[3]) + 16)
+            box = (
+                min(int(pos[:, 0].min().floor()), box[0]) - 16,
+                min(int(pos[:, 1].min().floor()), box[1]) - 16,
+                max(int(pos[:, 0].max().ceil()), box[2]) + 16,
+                max(int(pos[:, 1].max().ceil()), box[3]) + 16,
+            )
             # Rescale keypoints.
             pos[:, 0] = (pos[:, 0] - box[0]) * 256.0 / (box[2] - box[0])
@@ -239,7 +241,7 @@ class PascalVOCKeypoints(InMemoryDataset):
             path = osp.join(image_path, f'{filename}.jpg')
             with open(path, 'rb') as f:
                 img = Image.open(f).convert('RGB').crop(box)
-                img = img.resize((256, 256), resample=Image.BICUBIC)
+                img = img.resize((256, 256), resample=Image.Resampling.BICUBIC)
             img = transform(img)

torch_geometric/datasets/pascal_pf.py CHANGED Viewed

@@ -66,7 +66,7 @@ class PascalPF(InMemoryDataset):
         super().__init__(root, transform, pre_transform, pre_filter,
                          force_reload=force_reload)
         self.load(self.processed_paths[0])
-        self.pairs = torch.load(self.processed_paths[1])
+        self.pairs = fs.torch_load(self.processed_paths[1])
     @property
     def raw_file_names(self) -> List[str]:

torch_geometric/datasets/pcpnet_dataset.py CHANGED Viewed

@@ -121,7 +121,7 @@ class PCPNetDataset(InMemoryDataset):
     def process(self) -> None:
         path_file = self.raw_paths
-        with open(path_file[0], "r") as f:
+        with open(path_file[0]) as f:
             filenames = f.read().split('\n')[:-1]
         data_list = []
         for filename in filenames:

torch_geometric/datasets/pcqm4m.py CHANGED Viewed

@@ -7,7 +7,8 @@ from tqdm import tqdm
 from torch_geometric.data import Data, OnDiskDataset, download_url, extract_zip
 from torch_geometric.data.data import BaseData
-from torch_geometric.utils import from_smiles
+from torch_geometric.io import fs
+from torch_geometric.utils import from_smiles as _from_smiles
 class PCQM4Mv2(OnDiskDataset):
@@ -36,6 +37,10 @@ class PCQM4Mv2(OnDiskDataset):
             (default: :obj:`None`)
         backend (str): The :class:`Database` backend to use.
             (default: :obj:`"sqlite"`)
+        from_smiles (callable, optional): A custom function that takes a SMILES
+            string and outputs a :obj:`~torch_geometric.data.Data` object.
+            If not set, defaults to :meth:`~torch_geometric.utils.from_smiles`.
+            (default: :obj:`None`)
     """
     url = ('https://dgl-data.s3-accelerate.amazonaws.com/dataset/OGB-LSC/'
            'pcqm4m-v2.zip')
@@ -53,6 +58,7 @@ class PCQM4Mv2(OnDiskDataset):
         split: str = 'train',
         transform: Optional[Callable] = None,
         backend: str = 'sqlite',
+        from_smiles: Optional[Callable] = None,
     ) -> None:
         assert split in ['train', 'val', 'test', 'holdout']
@@ -64,9 +70,10 @@ class PCQM4Mv2(OnDiskDataset):
             'y': float,
         }
+        self.from_smiles = from_smiles or _from_smiles
         super().__init__(root, transform, backend=backend, schema=schema)
-        split_idx = torch.load(self.raw_paths[1])
+        split_idx = fs.torch_load(self.raw_paths[1])
         self._indices = split_idx[self.split_mapping[split]].tolist()
     @property
@@ -89,7 +96,7 @@ class PCQM4Mv2(OnDiskDataset):
         data_list: List[Data] = []
         iterator = enumerate(zip(df['smiles'], df['homolumogap']))
         for i, (smiles, y) in tqdm(iterator, total=len(df)):
-            data = from_smiles(smiles)
+            data = self.from_smiles(smiles)
             data.y = y
             data_list.append(data)

torch_geometric/datasets/ppi.py CHANGED Viewed

@@ -106,7 +106,7 @@ class PPI(InMemoryDataset):
         for s, split in enumerate(['train', 'valid', 'test']):
             path = osp.join(self.raw_dir, f'{split}_graph.json')
-            with open(path, 'r') as f:
+            with open(path) as f:
                 G = nx.DiGraph(json_graph.node_link_graph(json.load(f)))
             x = np.load(osp.join(self.raw_dir, f'{split}_feats.npy'))

torch_geometric/datasets/qm9.py CHANGED Viewed

@@ -13,6 +13,7 @@ from torch_geometric.data import (
     download_url,
     extract_zip,
 )
+from torch_geometric.io import fs
 from torch_geometric.utils import one_hot, scatter
 HAR2EV = 27.211386246
@@ -198,21 +199,21 @@ class QM9(InMemoryDataset):
     def process(self) -> None:
         try:
-            import rdkit
             from rdkit import Chem, RDLogger
             from rdkit.Chem.rdchem import BondType as BT
             from rdkit.Chem.rdchem import HybridizationType
-            RDLogger.DisableLog('rdApp.*')
+            RDLogger.DisableLog('rdApp.*')  # type: ignore
+            WITH_RDKIT = True
         except ImportError:
-            rdkit = None
+            WITH_RDKIT = False
-        if rdkit is None:
+        if not WITH_RDKIT:
             print(("Using a pre-processed version of the dataset. Please "
                    "install 'rdkit' to alternatively process the raw data."),
                   file=sys.stderr)
-            data_list = torch.load(self.raw_paths[0])
+            data_list = fs.torch_load(self.raw_paths[0])
             data_list = [Data(**data_dict) for data_dict in data_list]
             if self.pre_filter is not None:
@@ -227,14 +228,14 @@ class QM9(InMemoryDataset):
         types = {'H': 0, 'C': 1, 'N': 2, 'O': 3, 'F': 4}
         bonds = {BT.SINGLE: 0, BT.DOUBLE: 1, BT.TRIPLE: 2, BT.AROMATIC: 3}
-        with open(self.raw_paths[1], 'r') as f:
+        with open(self.raw_paths[1]) as f:
             target = [[float(x) for x in line.split(',')[1:20]]
                       for line in f.read().split('\n')[1:-1]]
             y = torch.tensor(target, dtype=torch.float)
             y = torch.cat([y[:, 3:], y[:, :3]], dim=-1)
             y = y * conversion.view(1, -1)
-        with open(self.raw_paths[2], 'r') as f:
+        with open(self.raw_paths[2]) as f:
             skip = [int(x.split()[0]) - 1 for x in f.read().split('\n')[9:-2]]
         suppl = Chem.SDMolSupplier(self.raw_paths[0], removeHs=False,

torch_geometric/datasets/rcdd.py CHANGED Viewed

@@ -85,13 +85,13 @@ class RCDD(InMemoryDataset):
         mapping = torch.empty(len(node_df), dtype=torch.long)
         for node_type in node_df['node_type'].unique():
             mask = node_df['node_type'] == node_type
-            mask = torch.from_numpy(mask.values)
-            num_nodes = int(mask.sum())
-            mapping[mask] = torch.arange(num_nodes)
+            node_id = torch.from_numpy(node_df['node_id'][mask].values)
+            num_nodes = mask.sum()
+            mapping[node_id] = torch.arange(num_nodes)
             data[node_type].num_nodes = num_nodes
             x = np.vstack([
                 np.asarray(f.split(':'), dtype=np.float32)
-                for f in node_df['node_feat'][mask.numpy()]
+                for f in node_df['node_feat'][mask]
             ])
             data[node_type].x = torch.from_numpy(x)

torch_geometric/datasets/reddit.py CHANGED Viewed

@@ -3,7 +3,6 @@ import os.path as osp
 from typing import Callable, List, Optional
 import numpy as np
-import scipy.sparse as sp
 import torch
 from torch_geometric.data import (
@@ -76,6 +75,8 @@ class Reddit(InMemoryDataset):
         os.unlink(path)
     def process(self) -> None:
+        import scipy.sparse as sp
         data = np.load(osp.join(self.raw_dir, 'reddit_data.npz'))
         x = torch.from_numpy(data['feature']).to(torch.float)
         y = torch.from_numpy(data['label']).to(torch.long)

torch_geometric/datasets/reddit2.py CHANGED Viewed

@@ -3,7 +3,6 @@ import os.path as osp
 from typing import Callable, List, Optional
 import numpy as np
-import scipy.sparse as sp
 import torch
 from torch_geometric.data import Data, InMemoryDataset, download_google_url
@@ -81,6 +80,8 @@ class Reddit2(InMemoryDataset):
         download_google_url(self.role_id, self.raw_dir, 'role.json')
     def process(self) -> None:
+        import scipy.sparse as sp
         f = np.load(osp.join(self.raw_dir, 'adj_full.npz'))
         adj = sp.csr_matrix((f['data'], f['indices'], f['indptr']), f['shape'])
         adj = adj.tocoo()

torch_geometric/datasets/rel_link_pred_dataset.py CHANGED Viewed

@@ -89,17 +89,17 @@ class RelLinkPredDataset(InMemoryDataset):
             download_url(f'{self.urls[self.name]}/{file_name}', self.raw_dir)
     def process(self) -> None:
-        with open(osp.join(self.raw_dir, 'entities.dict'), 'r') as f:
+        with open(osp.join(self.raw_dir, 'entities.dict')) as f:
             lines = [row.split('\t') for row in f.read().split('\n')[:-1]]
             entities_dict = {key: int(value) for value, key in lines}
-        with open(osp.join(self.raw_dir, 'relations.dict'), 'r') as f:
+        with open(osp.join(self.raw_dir, 'relations.dict')) as f:
             lines = [row.split('\t') for row in f.read().split('\n')[:-1]]
             relations_dict = {key: int(value) for value, key in lines}
         kwargs = {}
         for split in ['train', 'valid', 'test']:
-            with open(osp.join(self.raw_dir, f'{split}.txt'), 'r') as f:
+            with open(osp.join(self.raw_dir, f'{split}.txt')) as f:
                 lines = [row.split('\t') for row in f.read().split('\n')[:-1]]
                 src = [entities_dict[row[0]] for row in lines]
                 rel = [relations_dict[row[1]] for row in lines]

torch_geometric/datasets/s3dis.py CHANGED Viewed

@@ -3,6 +3,7 @@ import os.path as osp
 from typing import Callable, List, Optional
 import torch
+from torch import Tensor
 from torch_geometric.data import (
     Data,
@@ -85,13 +86,14 @@ class S3DIS(InMemoryDataset):
     def process(self) -> None:
         import h5py
-        with open(self.raw_paths[0], 'r') as f:
+        with open(self.raw_paths[0]) as f:
             filenames = [x.split('/')[-1] for x in f.read().split('\n')[:-1]]
-        with open(self.raw_paths[1], 'r') as f:
+        with open(self.raw_paths[1]) as f:
             rooms = f.read().split('\n')[:-1]
-        xs, ys = [], []
+        xs: List[Tensor] = []
+        ys: List[Tensor] = []
         for filename in filenames:
             h5 = h5py.File(osp.join(self.raw_dir, filename))
             xs += torch.from_numpy(h5['data'][:]).unbind(0)

torch_geometric/datasets/shapenet.py CHANGED Viewed

@@ -148,8 +148,8 @@ class ShapeNet(InMemoryDataset):
         elif split == 'trainval':
             path = self.processed_paths[3]
         else:
-            raise ValueError((f'Split {split} found, but expected either '
-                              'train, val, trainval or test'))
+            raise ValueError(f'Split {split} found, but expected either '
+                             'train, val, trainval or test')
         self.load(path)
@@ -213,7 +213,7 @@ class ShapeNet(InMemoryDataset):
         for i, split in enumerate(['train', 'val', 'test']):
             path = osp.join(self.raw_dir, 'train_test_split',
                             f'shuffled_{split}_file_list.json')
-            with open(path, 'r') as f:
+            with open(path) as f:
                 filenames = [
                     osp.sep.join(name.split('/')[1:]) + '.txt'
                     for name in json.load(f)

torch_geometric/datasets/shrec2016.py CHANGED Viewed

@@ -6,7 +6,7 @@ from typing import Callable, List, Optional
 import torch
 from torch_geometric.data import InMemoryDataset, download_url, extract_zip
-from torch_geometric.io import read_off, read_txt_array
+from torch_geometric.io import fs, read_off, read_txt_array
 class SHREC2016(InMemoryDataset):
@@ -79,7 +79,7 @@ class SHREC2016(InMemoryDataset):
         self.cat = category.lower()
         super().__init__(root, transform, pre_transform, pre_filter,
                          force_reload=force_reload)
-        self.__ref__ = torch.load(self.processed_paths[0])
+        self.__ref__ = fs.torch_load(self.processed_paths[0])
         path = self.processed_paths[1] if train else self.processed_paths[2]
         self.load(path)

torch_geometric/datasets/snap_dataset.py CHANGED Viewed

@@ -22,6 +22,9 @@ class EgoData(Data):
 def read_ego(files: List[str], name: str) -> List[EgoData]:
     import pandas as pd
+    import tqdm
+    files = sorted(files)
     all_featnames = []
     files = [
@@ -38,7 +41,7 @@ def read_ego(files: List[str], name: str) -> List[EgoData]:
     all_featnames_dict = {key: i for i, key in enumerate(all_featnames)}
     data_list = []
-    for i in range(0, len(files), 5):
+    for i in tqdm.tqdm(range(0, len(files), 5)):
         circles_file = files[i]
         edges_file = files[i + 1]
         egofeat_file = files[i + 2]
@@ -65,6 +68,9 @@ def read_ego(files: List[str], name: str) -> List[EgoData]:
             x_all[:, torch.tensor(indices)] = x
             x = x_all
+            if x.size(1) > 100_000:
+                x = x.to_sparse_csr()
         idx = pd.read_csv(feat_file, sep=' ', header=None, dtype=str,
                           usecols=[0]).squeeze()

pyg-nightly 2.6.0.dev20240318__py3-none-any.whl → 2.7.0.dev20250115__py3-none-any.whl

pyg-nightly 2.6.0.dev20240318py3-none-any.whl → 2.7.0.dev20250115py3-none-any.whl