PyPI - multipers - Versions diffs - 2.2.3__cp310-cp310-win_amd64.whl → 2.3.0__cp310-cp310-win_amd64.whl - Mend

multipers 2.2.3__cp310-cp310-win_amd64.whl → 2.3.0__cp310-cp310-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of multipers might be problematic. Click here for more details.

Files changed (182) hide show

multipers/__init__.py +33 -31
multipers/_signed_measure_meta.py +430 -430
multipers/_slicer_meta.py +211 -212
multipers/data/MOL2.py +458 -458
multipers/data/UCR.py +18 -18
multipers/data/graphs.py +466 -466
multipers/data/immuno_regions.py +27 -27
multipers/data/pytorch2simplextree.py +90 -90
multipers/data/shape3d.py +101 -101
multipers/data/synthetic.py +113 -111
multipers/distances.py +198 -198
multipers/filtration_conversions.pxd.tp +84 -84
multipers/filtrations/__init__.py +18 -0
multipers/filtrations/filtrations.py +289 -0
multipers/filtrations.pxd +224 -224
multipers/function_rips.cp310-win_amd64.pyd +0 -0
multipers/function_rips.pyx +105 -105
multipers/grids.cp310-win_amd64.pyd +0 -0
multipers/grids.pyx +350 -350
multipers/gudhi/Persistence_slices_interface.h +132 -132
multipers/gudhi/Simplex_tree_interface.h +239 -245
multipers/gudhi/Simplex_tree_multi_interface.h +516 -561
multipers/gudhi/cubical_to_boundary.h +59 -59
multipers/gudhi/gudhi/Bitmap_cubical_complex.h +450 -450
multipers/gudhi/gudhi/Bitmap_cubical_complex_base.h +1070 -1070
multipers/gudhi/gudhi/Bitmap_cubical_complex_periodic_boundary_conditions_base.h +579 -579
multipers/gudhi/gudhi/Debug_utils.h +45 -45
multipers/gudhi/gudhi/Fields/Multi_field.h +484 -484
multipers/gudhi/gudhi/Fields/Multi_field_operators.h +455 -455
multipers/gudhi/gudhi/Fields/Multi_field_shared.h +450 -450
multipers/gudhi/gudhi/Fields/Multi_field_small.h +531 -531
multipers/gudhi/gudhi/Fields/Multi_field_small_operators.h +507 -507
multipers/gudhi/gudhi/Fields/Multi_field_small_shared.h +531 -531
multipers/gudhi/gudhi/Fields/Z2_field.h +355 -355
multipers/gudhi/gudhi/Fields/Z2_field_operators.h +376 -376
multipers/gudhi/gudhi/Fields/Zp_field.h +420 -420
multipers/gudhi/gudhi/Fields/Zp_field_operators.h +400 -400
multipers/gudhi/gudhi/Fields/Zp_field_shared.h +418 -418
multipers/gudhi/gudhi/Flag_complex_edge_collapser.h +337 -337
multipers/gudhi/gudhi/Matrix.h +2107 -2107
multipers/gudhi/gudhi/Multi_critical_filtration.h +1038 -1038
multipers/gudhi/gudhi/Multi_persistence/Box.h +171 -171
multipers/gudhi/gudhi/Multi_persistence/Line.h +282 -282
multipers/gudhi/gudhi/Off_reader.h +173 -173
multipers/gudhi/gudhi/One_critical_filtration.h +1432 -1431
multipers/gudhi/gudhi/Persistence_matrix/Base_matrix.h +769 -769
multipers/gudhi/gudhi/Persistence_matrix/Base_matrix_with_column_compression.h +686 -686
multipers/gudhi/gudhi/Persistence_matrix/Boundary_matrix.h +842 -842
multipers/gudhi/gudhi/Persistence_matrix/Chain_matrix.h +1350 -1350
multipers/gudhi/gudhi/Persistence_matrix/Id_to_index_overlay.h +1105 -1105
multipers/gudhi/gudhi/Persistence_matrix/Position_to_index_overlay.h +859 -859
multipers/gudhi/gudhi/Persistence_matrix/RU_matrix.h +910 -910
multipers/gudhi/gudhi/Persistence_matrix/allocators/entry_constructors.h +139 -139
multipers/gudhi/gudhi/Persistence_matrix/base_pairing.h +230 -230
multipers/gudhi/gudhi/Persistence_matrix/base_swap.h +211 -211
multipers/gudhi/gudhi/Persistence_matrix/boundary_cell_position_to_id_mapper.h +60 -60
multipers/gudhi/gudhi/Persistence_matrix/boundary_face_position_to_id_mapper.h +60 -60
multipers/gudhi/gudhi/Persistence_matrix/chain_pairing.h +136 -136
multipers/gudhi/gudhi/Persistence_matrix/chain_rep_cycles.h +190 -190
multipers/gudhi/gudhi/Persistence_matrix/chain_vine_swap.h +616 -616
multipers/gudhi/gudhi/Persistence_matrix/columns/chain_column_extra_properties.h +150 -150
multipers/gudhi/gudhi/Persistence_matrix/columns/column_dimension_holder.h +106 -106
multipers/gudhi/gudhi/Persistence_matrix/columns/column_utilities.h +219 -219
multipers/gudhi/gudhi/Persistence_matrix/columns/entry_types.h +327 -327
multipers/gudhi/gudhi/Persistence_matrix/columns/heap_column.h +1140 -1140
multipers/gudhi/gudhi/Persistence_matrix/columns/intrusive_list_column.h +934 -934
multipers/gudhi/gudhi/Persistence_matrix/columns/intrusive_set_column.h +934 -934
multipers/gudhi/gudhi/Persistence_matrix/columns/list_column.h +980 -980
multipers/gudhi/gudhi/Persistence_matrix/columns/naive_vector_column.h +1092 -1092
multipers/gudhi/gudhi/Persistence_matrix/columns/row_access.h +192 -192
multipers/gudhi/gudhi/Persistence_matrix/columns/set_column.h +921 -921
multipers/gudhi/gudhi/Persistence_matrix/columns/small_vector_column.h +1093 -1093
multipers/gudhi/gudhi/Persistence_matrix/columns/unordered_set_column.h +1012 -1012
multipers/gudhi/gudhi/Persistence_matrix/columns/vector_column.h +1244 -1244
multipers/gudhi/gudhi/Persistence_matrix/matrix_dimension_holders.h +186 -186
multipers/gudhi/gudhi/Persistence_matrix/matrix_row_access.h +164 -164
multipers/gudhi/gudhi/Persistence_matrix/ru_pairing.h +156 -156
multipers/gudhi/gudhi/Persistence_matrix/ru_rep_cycles.h +376 -376
multipers/gudhi/gudhi/Persistence_matrix/ru_vine_swap.h +540 -540
multipers/gudhi/gudhi/Persistent_cohomology/Field_Zp.h +118 -118
multipers/gudhi/gudhi/Persistent_cohomology/Multi_field.h +173 -173
multipers/gudhi/gudhi/Persistent_cohomology/Persistent_cohomology_column.h +128 -128
multipers/gudhi/gudhi/Persistent_cohomology.h +745 -745
multipers/gudhi/gudhi/Points_off_io.h +171 -171
multipers/gudhi/gudhi/Simple_object_pool.h +69 -69
multipers/gudhi/gudhi/Simplex_tree/Simplex_tree_iterators.h +463 -463
multipers/gudhi/gudhi/Simplex_tree/Simplex_tree_node_explicit_storage.h +83 -83
multipers/gudhi/gudhi/Simplex_tree/Simplex_tree_siblings.h +106 -106
multipers/gudhi/gudhi/Simplex_tree/Simplex_tree_star_simplex_iterators.h +277 -277
multipers/gudhi/gudhi/Simplex_tree/hooks_simplex_base.h +62 -62
multipers/gudhi/gudhi/Simplex_tree/indexing_tag.h +27 -27
multipers/gudhi/gudhi/Simplex_tree/serialization_utils.h +62 -62
multipers/gudhi/gudhi/Simplex_tree/simplex_tree_options.h +157 -157
multipers/gudhi/gudhi/Simplex_tree.h +2794 -2794
multipers/gudhi/gudhi/Simplex_tree_multi.h +152 -163
multipers/gudhi/gudhi/distance_functions.h +62 -62
multipers/gudhi/gudhi/graph_simplicial_complex.h +104 -104
multipers/gudhi/gudhi/persistence_interval.h +253 -253
multipers/gudhi/gudhi/persistence_matrix_options.h +170 -170
multipers/gudhi/gudhi/reader_utils.h +367 -367
multipers/gudhi/mma_interface_coh.h +256 -255
multipers/gudhi/mma_interface_h0.h +223 -231
multipers/gudhi/mma_interface_matrix.h +284 -282
multipers/gudhi/naive_merge_tree.h +536 -575
multipers/gudhi/scc_io.h +310 -289
multipers/gudhi/truc.h +890 -888
multipers/io.cp310-win_amd64.pyd +0 -0
multipers/io.pyx +711 -711
multipers/ml/accuracies.py +90 -90
multipers/ml/convolutions.py +520 -520
multipers/ml/invariants_with_persistable.py +79 -79
multipers/ml/kernels.py +176 -176
multipers/ml/mma.py +713 -714
multipers/ml/one.py +472 -472
multipers/ml/point_clouds.py +352 -346
multipers/ml/signed_measures.py +1589 -1589
multipers/ml/sliced_wasserstein.py +461 -461
multipers/ml/tools.py +113 -113
multipers/mma_structures.cp310-win_amd64.pyd +0 -0
multipers/mma_structures.pxd +127 -127
multipers/mma_structures.pyx +4 -4
multipers/mma_structures.pyx.tp +1085 -1085
multipers/multi_parameter_rank_invariant/diff_helpers.h +84 -93
multipers/multi_parameter_rank_invariant/euler_characteristic.h +97 -97
multipers/multi_parameter_rank_invariant/function_rips.h +322 -322
multipers/multi_parameter_rank_invariant/hilbert_function.h +769 -769
multipers/multi_parameter_rank_invariant/persistence_slices.h +148 -148
multipers/multi_parameter_rank_invariant/rank_invariant.h +369 -369
multipers/multiparameter_edge_collapse.py +41 -41
multipers/multiparameter_module_approximation/approximation.h +2296 -2295
multipers/multiparameter_module_approximation/combinatory.h +129 -129
multipers/multiparameter_module_approximation/debug.h +107 -107
multipers/multiparameter_module_approximation/format_python-cpp.h +286 -286
multipers/multiparameter_module_approximation/heap_column.h +238 -238
multipers/multiparameter_module_approximation/images.h +79 -79
multipers/multiparameter_module_approximation/list_column.h +174 -174
multipers/multiparameter_module_approximation/list_column_2.h +232 -232
multipers/multiparameter_module_approximation/ru_matrix.h +347 -347
multipers/multiparameter_module_approximation/set_column.h +135 -135
multipers/multiparameter_module_approximation/structure_higher_dim_barcode.h +36 -36
multipers/multiparameter_module_approximation/unordered_set_column.h +166 -166
multipers/multiparameter_module_approximation/utilities.h +403 -419
multipers/multiparameter_module_approximation/vector_column.h +223 -223
multipers/multiparameter_module_approximation/vector_matrix.h +331 -331
multipers/multiparameter_module_approximation/vineyards.h +464 -464
multipers/multiparameter_module_approximation/vineyards_trajectories.h +649 -649
multipers/multiparameter_module_approximation.cp310-win_amd64.pyd +0 -0
multipers/multiparameter_module_approximation.pyx +216 -217
multipers/pickle.py +90 -53
multipers/plots.py +342 -334
multipers/point_measure.cp310-win_amd64.pyd +0 -0
multipers/point_measure.pyx +322 -320
multipers/simplex_tree_multi.cp310-win_amd64.pyd +0 -0
multipers/simplex_tree_multi.pxd +133 -133
multipers/simplex_tree_multi.pyx +18 -15
multipers/simplex_tree_multi.pyx.tp +1939 -1935
multipers/slicer.cp310-win_amd64.pyd +0 -0
multipers/slicer.pxd +81 -20
multipers/slicer.pxd.tp +215 -214
multipers/slicer.pyx +1091 -308
multipers/slicer.pyx.tp +924 -914
multipers/tensor/tensor.h +672 -672
multipers/tensor.pxd +13 -13
multipers/test.pyx +44 -44
multipers/tests/__init__.py +57 -57
multipers/torch/diff_grids.py +217 -217
multipers/torch/rips_density.py +310 -304
{multipers-2.2.3.dist-info → multipers-2.3.0.dist-info}/LICENSE +21 -21
{multipers-2.2.3.dist-info → multipers-2.3.0.dist-info}/METADATA +21 -11
multipers-2.3.0.dist-info/RECORD +182 -0
multipers/tests/test_diff_helper.py +0 -73
multipers/tests/test_hilbert_function.py +0 -82
multipers/tests/test_mma.py +0 -83
multipers/tests/test_point_clouds.py +0 -49
multipers/tests/test_python-cpp_conversion.py +0 -82
multipers/tests/test_signed_betti.py +0 -181
multipers/tests/test_signed_measure.py +0 -89
multipers/tests/test_simplextreemulti.py +0 -221
multipers/tests/test_slicer.py +0 -221
multipers-2.2.3.dist-info/RECORD +0 -189
{multipers-2.2.3.dist-info → multipers-2.3.0.dist-info}/WHEEL +0 -0
{multipers-2.2.3.dist-info → multipers-2.3.0.dist-info}/top_level.txt +0 -0

multipers/data/immuno_regions.py CHANGED Viewed

@@ -1,27 +1,27 @@
-import numpy as np
-from pandas import read_csv
-from os.path import expanduser
-from os import walk
-from sklearn.preprocessing import LabelEncoder
-def get(DATASET_PATH = expanduser("~/Datasets/")):
-	DATASET_PATH += "1.5mmRegions/"
-	X, labels = [],[]
-	for label in ["FoxP3", "CD8", "CD68"]:
-	#     for label in ["FoxP3", "CD8"]:
-		for root, dirs, files in walk(DATASET_PATH + label+"/"):
-			for name in files:
-				X.append(np.array(read_csv(DATASET_PATH+label+"/"+name))/1500) ## Rescaled
-				labels.append(label)
-	return X, LabelEncoder().fit_transform(np.array(labels))
-def get_immuno(i=1, DATASET_PATH = expanduser("~/Datasets/")):
-	immu_dataset = read_csv(DATASET_PATH+f"LargeHypoxicRegion{i}.csv")
-	X = np.array(immu_dataset['x'])
-	X /= np.max(X)
-	Y = np.array(immu_dataset['y'])
-	Y /= np.max(Y)
-	labels = LabelEncoder().fit_transform(immu_dataset['Celltype'])
-	return np.asarray([X,Y]).T, labels
+import numpy as np
+from pandas import read_csv
+from os.path import expanduser
+from os import walk
+from sklearn.preprocessing import LabelEncoder
+def get(DATASET_PATH = expanduser("~/Datasets/")):
+	DATASET_PATH += "1.5mmRegions/"
+	X, labels = [],[]
+	for label in ["FoxP3", "CD8", "CD68"]:
+	#     for label in ["FoxP3", "CD8"]:
+		for root, dirs, files in walk(DATASET_PATH + label+"/"):
+			for name in files:
+				X.append(np.array(read_csv(DATASET_PATH+label+"/"+name))/1500) ## Rescaled
+				labels.append(label)
+	return X, LabelEncoder().fit_transform(np.array(labels))
+def get_immuno(i=1, DATASET_PATH = expanduser("~/Datasets/")):
+	immu_dataset = read_csv(DATASET_PATH+f"LargeHypoxicRegion{i}.csv")
+	X = np.array(immu_dataset['x'])
+	X /= np.max(X)
+	Y = np.array(immu_dataset['y'])
+	Y /= np.max(Y)
+	labels = LabelEncoder().fit_transform(immu_dataset['Celltype'])
+	return np.asarray([X,Y]).T, labels

multipers/data/pytorch2simplextree.py CHANGED Viewed

@@ -1,91 +1,91 @@
-from tqdm import tqdm
-import numpy as np
-from torch_geometric.data.data import Data
-import networkx as nx
-from sklearn.base import BaseEstimator, TransformerMixin
-from typing import Iterable
-def modelnet2pts2gs(train_dataset, test_dataset , nbr_size = 8, exp_flag = True, labels_only = False,n=100, n_jobs=1, random=False):
-	from sklearn.neighbors import kneighbors_graph
-	"""
-    sample points and create neighborhoold graph
-	"""
-	dataset = train_dataset + test_dataset
-	indices = np.random.choice(range(len(dataset)),replace=False, size=n) if random else range(n)
-	dataset:list[Data] = [dataset[i] for i in indices]
-	_,labels = torch_geometric_2nx(dataset, labels_only=True)
-	if labels_only: return labels
-	def data2graph(data:Data):
-		pos = data.pos.numpy()
-		adj = kneighbors_graph(pos, nbr_size, mode='distance', n_jobs=n_jobs)
-		g = nx.from_scipy_sparse_array(adj, edge_attribute= 'weight')
-		if exp_flag:
-			for u, v in g.edges(): # TODO optimize
-				g[u][v]['weight'] = np.exp(-g[u][v]['weight'])
-		return g
-		#TODO : nx.set_edge_attributes()
-	return [data2graph(data) for data in dataset], labels
-def torch_geometric_2nx(dataset, labels_only = False, print_flag = False, weight_flag = False):
-	"""
-	:param dataset:
-	:param labels_only: return labels only
-	:param print_flag:
-	:param weight_flag: whether computing distance as weights or not
-	:return:
-	"""
-	if labels_only:
-		return None, [int(data.y) for data in dataset]
-	def data2graph(data:Data):
-		edges = np.unique(data.edge_index.numpy().T, axis=0)
-		g = nx.from_edgelist(edges)
-		edge_filtration = {(u,v):np.linalg.norm(data.pos[u] - data.pos[v]) for u,v in g.edges}
-		nx.set_node_attributes(g,{node:0 for node in g.nodes}, "geodesic")
-		nx.set_edge_attributes(g, edge_filtration, "geodesic")
-		return g
-	return [data2graph(data) for data in tqdm(dataset, desc="Turning Data to graphs")], [int(data.y) for data in dataset]
-def modelnet2graphs(version = '10', print_flag = False, labels_only = False, a = 0, b = 10, weight_flag = False):
-	""" load modelnet 10 or 40 and convert to graphs"""
-	from torch_geometric.transforms import FaceToEdge
-	from .shape3d import load_modelnet
-	train_dataset, test_dataset = load_modelnet(version, point_flag = False)
-	dataset = train_dataset + test_dataset
-	if b>0:	dataset = [dataset[i] for i in range(a,b)]
-	if labels_only:
-		return torch_geometric_2nx(dataset, labels_only=True)
-	dataset = [FaceToEdge(remove_faces=False)(data) for data in dataset]
-	graphs, labels = torch_geometric_2nx(dataset, print_flag=print_flag, weight_flag= weight_flag)
-	return graphs, labels
-class Torch2SimplexTree(BaseEstimator,TransformerMixin):
-	"""
-	WARNING : build in progress
-	PyTorch Data-like to simplextree.
-	Input
-	-----
-	Class having `pos`, `edges`, `faces` methods
-	Filtrations
-	-----------
-	 - Geodesic (geodesic rips)
-	 - eccentricity
-	"""
-	import multipers as mp
-	def __init__(self, filtrations:Iterable[str]=[]):
-		super().__init__()
-	def fit(self, X, y=None):
-		return self
-	def transform(self,X:list[nx.Graph]):
+from tqdm import tqdm
+import numpy as np
+from torch_geometric.data.data import Data
+import networkx as nx
+from sklearn.base import BaseEstimator, TransformerMixin
+from typing import Iterable
+def modelnet2pts2gs(train_dataset, test_dataset , nbr_size = 8, exp_flag = True, labels_only = False,n=100, n_jobs=1, random=False):
+	from sklearn.neighbors import kneighbors_graph
+	"""
+    sample points and create neighborhoold graph
+	"""
+	dataset = train_dataset + test_dataset
+	indices = np.random.choice(range(len(dataset)),replace=False, size=n) if random else range(n)
+	dataset:list[Data] = [dataset[i] for i in indices]
+	_,labels = torch_geometric_2nx(dataset, labels_only=True)
+	if labels_only: return labels
+	def data2graph(data:Data):
+		pos = data.pos.numpy()
+		adj = kneighbors_graph(pos, nbr_size, mode='distance', n_jobs=n_jobs)
+		g = nx.from_scipy_sparse_array(adj, edge_attribute= 'weight')
+		if exp_flag:
+			for u, v in g.edges(): # TODO optimize
+				g[u][v]['weight'] = np.exp(-g[u][v]['weight'])
+		return g
+		#TODO : nx.set_edge_attributes()
+	return [data2graph(data) for data in dataset], labels
+def torch_geometric_2nx(dataset, labels_only = False, print_flag = False, weight_flag = False):
+	"""
+	:param dataset:
+	:param labels_only: return labels only
+	:param print_flag:
+	:param weight_flag: whether computing distance as weights or not
+	:return:
+	"""
+	if labels_only:
+		return None, [int(data.y) for data in dataset]
+	def data2graph(data:Data):
+		edges = np.unique(data.edge_index.numpy().T, axis=0)
+		g = nx.from_edgelist(edges)
+		edge_filtration = {(u,v):np.linalg.norm(data.pos[u] - data.pos[v]) for u,v in g.edges}
+		nx.set_node_attributes(g,{node:0 for node in g.nodes}, "geodesic")
+		nx.set_edge_attributes(g, edge_filtration, "geodesic")
+		return g
+	return [data2graph(data) for data in tqdm(dataset, desc="Turning Data to graphs")], [int(data.y) for data in dataset]
+def modelnet2graphs(version = '10', print_flag = False, labels_only = False, a = 0, b = 10, weight_flag = False):
+	""" load modelnet 10 or 40 and convert to graphs"""
+	from torch_geometric.transforms import FaceToEdge
+	from .shape3d import load_modelnet
+	train_dataset, test_dataset = load_modelnet(version, point_flag = False)
+	dataset = train_dataset + test_dataset
+	if b>0:	dataset = [dataset[i] for i in range(a,b)]
+	if labels_only:
+		return torch_geometric_2nx(dataset, labels_only=True)
+	dataset = [FaceToEdge(remove_faces=False)(data) for data in dataset]
+	graphs, labels = torch_geometric_2nx(dataset, print_flag=print_flag, weight_flag= weight_flag)
+	return graphs, labels
+class Torch2SimplexTree(BaseEstimator,TransformerMixin):
+	"""
+	WARNING : build in progress
+	PyTorch Data-like to simplextree.
+	Input
+	-----
+	Class having `pos`, `edges`, `faces` methods
+	Filtrations
+	-----------
+	 - Geodesic (geodesic rips)
+	 - eccentricity
+	"""
+	import multipers as mp
+	def __init__(self, filtrations:Iterable[str]=[]):
+		super().__init__()
+	def fit(self, X, y=None):
+		return self
+	def transform(self,X:list[nx.Graph]):
 		return

multipers/data/shape3d.py CHANGED Viewed

@@ -1,101 +1,101 @@
-import numpy as np
-from os.path import expanduser
-from torch_geometric.datasets import ModelNet
-DATASET_PATH = expanduser("~/Datasets/")
-import os
-####################### MODELNET
-def load_modelnet(version='10', sample_points = False, reset:bool=False, remove_faces=False):
-	from torch_geometric.transforms import FaceToEdge, SamplePoints
-	"""
-	:param point_flag: Sample points if point_flag true. Otherwise load mesh
-	:return: train_dataset, test_dataset
-	"""
-	assert version in ['10', '40']
-	if sample_points:
-		pre_transform, transform = FaceToEdge(remove_faces=remove_faces), SamplePoints(num=sample_points)
-	else:
-		pre_transform, transform = FaceToEdge(remove_faces=remove_faces), None
-	path = f"{DATASET_PATH}/ModelNet{version}"
-	if reset:
-		# print(f"rm -rf {path}")
-		os.system(f"rm -rf {path+'/processed/'}")
-	train_dataset = ModelNet(path, name=version, train=True, transform=transform, pre_transform=pre_transform)
-	test_dataset = ModelNet(path, name=version, train=False, transform=transform, pre_transform=pre_transform)
-	return train_dataset, test_dataset
-def get_ModelNet(dataset, num_graph, seed):
-	train,test = load_modelnet(version=dataset[8:])
-	test_size = len(test) / len(train)
-	if num_graph >0:
-		np.random.seed(seed)
-		indices = np.random.choice(len(train), num_graph, replace=False)
-		train = train[indices]
-		indices = np.random.choice(len(test), int(num_graph*test_size), replace=False)
-		test = test[indices]
-		np.random.seed() # resets seed
-	return train, test
-def get(dataset:str, num_graph=0, seed=0, node_per_graph=0):
-	if dataset.startswith("ModelNet"):
-		return get_ModelNet(dataset=dataset, num_graph=num_graph, seed=seed)
-	datasets = get_(dataset=dataset, num_sample=num_graph)
-	graphs = []
-	labels = []
-	np.random.seed(seed)
-	for data, ls in datasets:
-		nodes = np.random.choice(range(len(data.pos)), replace=False, size=node_per_graph)
-		for i,node in enumerate(nodes):
-			data_ = data # if i == 0 else None # prevents doing copies
-			graphs.append([data_, node])
-			labels.append(ls[node])
-	return graphs, labels
-def get_(dataset:str, dataset_num:int|None=None, num_sample:int=0, DATASET_PATH = expanduser("~/Datasets/")):
-	from torch_geometric.io import read_off
-	if dataset.startswith("3dshapes/"):
-		dataset_ = dataset[len("3dshapes/"):]
-	else:
-		dataset_ = dataset
-	if dataset_num is None and "/" in dataset_:
-		position = dataset_.rfind("/")
-		dataset_num = int(dataset_[position+1:-4]) # cuts the "<dataset>/" and the ".off"
-		dataset_ = dataset_[:position]
-	if dataset_num is None: # gets a random (available) number for this dataset
-		from os import listdir
-		from random import choice
-		files = listdir(DATASET_PATH+f"3dshapes/{dataset_}")
-		if num_sample <= 0:
-			files = [file for file in files if "label" not in file]
-		else:
-			files = np.random.choice([file for file in files if "label" not in file], replace=False, size=num_sample)
-		dataset_nums = np.sort([int("".join([char for  char in file  if char.isnumeric()])) for file in files])
-		print("Dataset nums : ", *dataset_nums)
-		out = [get_(dataset_, dataset_num=num) for num in dataset_nums]
-		return out
-	path = DATASET_PATH+f"3dshapes/{dataset_}/{dataset_num}.off"
-	data = read_off(path)
-	faces = data.face.numpy().T
-	# data = FaceToEdge(remove_faces=remove_faces)(data)
-	#labels
-	label_path = path.split(".")[0] + "_labels.txt"
-	f = open(label_path, "r")
-	labels = np.zeros(len(data.pos), dtype="<U10") # Assumes labels are of size at most 10 chars
-	current_label=""
-	for i, line in enumerate(f.readlines()):
-		if i %  2 == 0:
-			current_label = line.strip()
-			continue
-		faces_of_label = np.array(line.strip().split(" "), dtype=int) -1 # this starts at 1, python starts at 0
-		# print(faces_of_label.min())
-		nodes_of_label = np.unique(faces[faces_of_label].flatten())
-		labels[nodes_of_label] = current_label  # les labels sont sur les faces
-	return data, labels
+import numpy as np
+from os.path import expanduser
+from torch_geometric.datasets import ModelNet
+DATASET_PATH = expanduser("~/Datasets/")
+import os
+####################### MODELNET
+def load_modelnet(version='10', sample_points = False, reset:bool=False, remove_faces=False):
+	from torch_geometric.transforms import FaceToEdge, SamplePoints
+	"""
+	:param point_flag: Sample points if point_flag true. Otherwise load mesh
+	:return: train_dataset, test_dataset
+	"""
+	assert version in ['10', '40']
+	if sample_points:
+		pre_transform, transform = FaceToEdge(remove_faces=remove_faces), SamplePoints(num=sample_points)
+	else:
+		pre_transform, transform = FaceToEdge(remove_faces=remove_faces), None
+	path = f"{DATASET_PATH}/ModelNet{version}"
+	if reset:
+		# print(f"rm -rf {path}")
+		os.system(f"rm -rf {path+'/processed/'}")
+	train_dataset = ModelNet(path, name=version, train=True, transform=transform, pre_transform=pre_transform)
+	test_dataset = ModelNet(path, name=version, train=False, transform=transform, pre_transform=pre_transform)
+	return train_dataset, test_dataset
+def get_ModelNet(dataset, num_graph, seed):
+	train,test = load_modelnet(version=dataset[8:])
+	test_size = len(test) / len(train)
+	if num_graph >0:
+		np.random.seed(seed)
+		indices = np.random.choice(len(train), num_graph, replace=False)
+		train = train[indices]
+		indices = np.random.choice(len(test), int(num_graph*test_size), replace=False)
+		test = test[indices]
+		np.random.seed() # resets seed
+	return train, test
+def get(dataset:str, num_graph=0, seed=0, node_per_graph=0):
+	if dataset.startswith("ModelNet"):
+		return get_ModelNet(dataset=dataset, num_graph=num_graph, seed=seed)
+	datasets = get_(dataset=dataset, num_sample=num_graph)
+	graphs = []
+	labels = []
+	np.random.seed(seed)
+	for data, ls in datasets:
+		nodes = np.random.choice(range(len(data.pos)), replace=False, size=node_per_graph)
+		for i,node in enumerate(nodes):
+			data_ = data # if i == 0 else None # prevents doing copies
+			graphs.append([data_, node])
+			labels.append(ls[node])
+	return graphs, labels
+def get_(dataset:str, dataset_num:int|None=None, num_sample:int=0, DATASET_PATH = expanduser("~/Datasets/")):
+	from torch_geometric.io import read_off
+	if dataset.startswith("3dshapes/"):
+		dataset_ = dataset[len("3dshapes/"):]
+	else:
+		dataset_ = dataset
+	if dataset_num is None and "/" in dataset_:
+		position = dataset_.rfind("/")
+		dataset_num = int(dataset_[position+1:-4]) # cuts the "<dataset>/" and the ".off"
+		dataset_ = dataset_[:position]
+	if dataset_num is None: # gets a random (available) number for this dataset
+		from os import listdir
+		from random import choice
+		files = listdir(DATASET_PATH+f"3dshapes/{dataset_}")
+		if num_sample <= 0:
+			files = [file for file in files if "label" not in file]
+		else:
+			files = np.random.choice([file for file in files if "label" not in file], replace=False, size=num_sample)
+		dataset_nums = np.sort([int("".join([char for  char in file  if char.isnumeric()])) for file in files])
+		print("Dataset nums : ", *dataset_nums)
+		out = [get_(dataset_, dataset_num=num) for num in dataset_nums]
+		return out
+	path = DATASET_PATH+f"3dshapes/{dataset_}/{dataset_num}.off"
+	data = read_off(path)
+	faces = data.face.numpy().T
+	# data = FaceToEdge(remove_faces=remove_faces)(data)
+	#labels
+	label_path = path.split(".")[0] + "_labels.txt"
+	f = open(label_path, "r")
+	labels = np.zeros(len(data.pos), dtype="<U10") # Assumes labels are of size at most 10 chars
+	current_label=""
+	for i, line in enumerate(f.readlines()):
+		if i %  2 == 0:
+			current_label = line.strip()
+			continue
+		faces_of_label = np.array(line.strip().split(" "), dtype=int) -1 # this starts at 1, python starts at 0
+		# print(faces_of_label.min())
+		nodes_of_label = np.unique(faces[faces_of_label].flatten())
+		labels[nodes_of_label] = current_label  # les labels sont sur les faces
+	return data, labels

multipers/data/synthetic.py CHANGED Viewed

@@ -1,111 +1,113 @@
-import numpy as np
-def noisy_annulus(
-    n1: int = 1000,
-    n2: int = 200,
-    r1: float = 1,
-    r2: float = 2,
-    dim: int = 2,
-    center: np.ndarray | list | None = None,
-    **kwargs
-) -> np.ndarray:
-    """Generates a noisy annulus dataset.
-    Parameters
-    ----------
-    r1 : float.
-            Lower radius of the annulus.
-    r2 : float.
-            Upper radius of the annulus.
-    n1 : int
-            Number of points in the annulus.
-    n2 : int
-            Number of points in the square.
-    dim : int
-            Dimension of the annulus.
-    center: list or array
-            center of the annulus.
-    Returns
-    -------
-    numpy array
-            Dataset. size : (n1+n2) x dim
-    """
-    theta = np.random.normal(size=(n1, dim))
-    theta /= np.linalg.norm(theta, axis=1)[:, None]
-    rs = np.sqrt(np.random.uniform(low=r1**2, high=r2**2, size=n1))
-    annulus = rs[:, None] * theta
-    if center is not None:
-        annulus += np.array(center)
-    diffuse_noise = np.random.uniform(size=(n2, dim), low=-1.1 * r2, high=1.1 * r2)
-    if center is not None:
-        diffuse_noise += np.array(center)
-    return np.vstack([annulus, diffuse_noise])
-def three_annulus(num_pts: int = 500, num_outliers: int = 500):
-    X = np.block(
-        [
-            [np.random.uniform(low=-2, high=2, size=(num_outliers, 2))],
-            [
-                np.array(
-                    noisy_annulus(
-                        r1=0.6,
-                        r2=0.9,
-                        n1=(int)(num_pts * 1 / 3),
-                        n2=0,
-                        center=[1, -0.2],
-                    )
-                )
-            ],
-            [
-                np.array(
-                    noisy_annulus(
-                        r1=0.4,
-                        r2=0.55,
-                        n1=(int)(num_pts * 1 / 3),
-                        n2=0,
-                        center=[-1.2, -1],
-                    )
-                )
-            ],
-            [
-                np.array(
-                    noisy_annulus(
-                        r1=0.3,
-                        r2=0.4,
-                        n1=(int)(num_pts * 1 / 3),
-                        n2=0,
-                        center=[-0.7, 1.1],
-                    )
-                )
-            ],
-        ]
-    )
-    return X
-def orbit(n: int = 1000, r: float = 1.0, x0=[]):
-    point_list = []
-    if len(x0) != 2:
-        x, y = np.random.uniform(size=2)
-    else:
-        x, y = x0
-    point_list.append([x, y])
-    for _ in range(n - 1):
-        x = (x + r * y * (1 - y)) % 1
-        y = (y + r * x * (1 - x)) % 1
-        point_list.append([x, y])
-    return np.asarray(point_list, dtype=float)
-def get_orbit5k(num_pts=1000, num_data=5000):
-    from sklearn.preprocessing import LabelEncoder
-    rs = [2.5, 3.5, 4, 4.1, 4.3]
-    labels = np.random.choice(rs, size=num_data, replace=True)
-    X = [orbit(n=num_pts, r=r) for r in labels]
-    labels = LabelEncoder().fit_transform(labels)
-    return X, labels
+import numpy as np
+def noisy_annulus(
+    n1: int = 1000,
+    n2: int = 200,
+    r1: float = 1,
+    r2: float = 2,
+    dim: int = 2,
+    center: np.ndarray | list | None = None,
+    **kwargs
+) -> np.ndarray:
+    """Generates a noisy annulus dataset.
+    Parameters
+    ----------
+    r1 : float.
+            Lower radius of the annulus.
+    r2 : float.
+            Upper radius of the annulus.
+    n1 : int
+            Number of points in the annulus.
+    n2 : int
+            Number of points in the square.
+    dim : int
+            Dimension of the annulus.
+    center: list or array
+            center of the annulus.
+    Returns
+    -------
+    numpy array
+            Dataset. size : (n1+n2) x dim
+    """
+    theta = np.random.normal(size=(n1, dim))
+    theta /= np.linalg.norm(theta, axis=1)[:, None]
+    rs = np.sqrt(np.random.uniform(low=r1**2, high=r2**2, size=n1))
+    annulus = rs[:, None] * theta
+    if center is not None:
+        annulus += np.array(center)
+    diffuse_noise = np.random.uniform(size=(n2, dim), low=-1.1 * r2, high=1.1 * r2)
+    if center is not None:
+        diffuse_noise += np.array(center)
+    return np.vstack([annulus, diffuse_noise])
+def three_annulus(num_pts: int = 500, num_outliers: int = 500):
+    q, r = divmod(num_pts, 3)
+    num_pts_1, num_pts_2, num_pts_3 =  q, q + (r > 0), q + (r > 1)
+    X = np.block(
+        [
+            [np.random.uniform(low=-2, high=2, size=(num_outliers, 2))],
+            [
+                np.array(
+                    noisy_annulus(
+                        r1=0.6,
+                        r2=0.9,
+                        n1=num_pts_1,
+                        n2=0,
+                        center=[1, -0.2],
+                    )
+                )
+            ],
+            [
+                np.array(
+                    noisy_annulus(
+                        r1=0.4,
+                        r2=0.55,
+                        n1=num_pts_2,
+                        n2=0,
+                        center=[-1.2, -1],
+                    )
+                )
+            ],
+            [
+                np.array(
+                    noisy_annulus(
+                        r1=0.3,
+                        r2=0.4,
+                        n1=num_pts_3,
+                        n2=0,
+                        center=[-0.7, 1.1],
+                    )
+                )
+            ],
+        ]
+    )
+    return X
+def orbit(n: int = 1000, r: float = 1.0, x0=[]):
+    point_list = []
+    if len(x0) != 2:
+        x, y = np.random.uniform(size=2)
+    else:
+        x, y = x0
+    point_list.append([x, y])
+    for _ in range(n - 1):
+        x = (x + r * y * (1 - y)) % 1
+        y = (y + r * x * (1 - x)) % 1
+        point_list.append([x, y])
+    return np.asarray(point_list, dtype=float)
+def get_orbit5k(num_pts=1000, num_data=5000):
+    from sklearn.preprocessing import LabelEncoder
+    rs = [2.5, 3.5, 4, 4.1, 4.3]
+    labels = np.random.choice(rs, size=num_data, replace=True)
+    X = [orbit(n=num_pts, r=r) for r in labels]
+    labels = LabelEncoder().fit_transform(labels)
+    return X, labels