PyPI - AeroViz - Versions diffs - 0.1.3__py3-none-any.whl → 0.1.4__py3-none-any.whl - Mend

AeroViz 0.1.3py3-none-any.whl → 0.1.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of AeroViz might be problematic. Click here for more details.

Files changed (121) hide show

AeroViz/__init__.py +7 -5
AeroViz/{config → data}/DEFAULT_DATA.csv +1 -1
AeroViz/dataProcess/Chemistry/__init__.py +40 -40
AeroViz/dataProcess/Chemistry/_calculate.py +15 -15
AeroViz/dataProcess/Chemistry/_isoropia.py +72 -68
AeroViz/dataProcess/Chemistry/_mass_volume.py +158 -161
AeroViz/dataProcess/Chemistry/_ocec.py +109 -109
AeroViz/dataProcess/Chemistry/_partition.py +19 -18
AeroViz/dataProcess/Chemistry/_teom.py +9 -11
AeroViz/dataProcess/Chemistry/isrpia.cnf +21 -0
AeroViz/dataProcess/Optical/Angstrom_exponent.py +20 -0
AeroViz/dataProcess/Optical/_IMPROVE.py +40 -41
AeroViz/dataProcess/Optical/__init__.py +29 -44
AeroViz/dataProcess/Optical/_absorption.py +21 -47
AeroViz/dataProcess/Optical/_extinction.py +31 -25
AeroViz/dataProcess/Optical/_mie.py +5 -7
AeroViz/dataProcess/Optical/_mie_sd.py +89 -90
AeroViz/dataProcess/Optical/_scattering.py +19 -20
AeroViz/dataProcess/SizeDistr/__init__.py +39 -39
AeroViz/dataProcess/SizeDistr/__merge.py +159 -158
AeroViz/dataProcess/SizeDistr/_merge.py +155 -154
AeroViz/dataProcess/SizeDistr/_merge_v1.py +162 -161
AeroViz/dataProcess/SizeDistr/_merge_v2.py +153 -152
AeroViz/dataProcess/SizeDistr/_merge_v3.py +327 -327
AeroViz/dataProcess/SizeDistr/_merge_v4.py +273 -275
AeroViz/dataProcess/SizeDistr/_size_distr.py +51 -51
AeroViz/dataProcess/VOC/__init__.py +9 -9
AeroViz/dataProcess/VOC/_potential_par.py +53 -55
AeroViz/dataProcess/__init__.py +28 -6
AeroViz/dataProcess/core/__init__.py +59 -65
AeroViz/plot/__init__.py +7 -2
AeroViz/plot/bar.py +126 -0
AeroViz/plot/box.py +69 -0
AeroViz/plot/distribution/distribution.py +421 -427
AeroViz/plot/meteorology/meteorology.py +240 -292
AeroViz/plot/optical/__init__.py +0 -1
AeroViz/plot/optical/optical.py +230 -230
AeroViz/plot/pie.py +198 -0
AeroViz/plot/regression.py +196 -0
AeroViz/plot/scatter.py +165 -0
AeroViz/plot/templates/__init__.py +2 -4
AeroViz/plot/templates/ammonium_rich.py +34 -0
AeroViz/plot/templates/contour.py +25 -25
AeroViz/plot/templates/corr_matrix.py +86 -93
AeroViz/plot/templates/diurnal_pattern.py +28 -26
AeroViz/plot/templates/koschmieder.py +59 -123
AeroViz/plot/templates/metal_heatmap.py +135 -37
AeroViz/plot/timeseries/__init__.py +1 -0
AeroViz/plot/timeseries/template.py +47 -0
AeroViz/plot/timeseries/timeseries.py +324 -264
AeroViz/plot/utils/__init__.py +2 -1
AeroViz/plot/utils/_color.py +57 -57
AeroViz/plot/utils/_unit.py +48 -48
AeroViz/plot/utils/plt_utils.py +92 -0
AeroViz/plot/utils/sklearn_utils.py +49 -0
AeroViz/plot/utils/units.json +5 -0
AeroViz/plot/violin.py +80 -0
AeroViz/process/__init__.py +17 -17
AeroViz/process/core/DataProc.py +9 -9
AeroViz/process/core/SizeDist.py +81 -81
AeroViz/process/method/PyMieScatt_update.py +488 -488
AeroViz/process/method/mie_theory.py +231 -229
AeroViz/process/method/prop.py +40 -40
AeroViz/process/script/AbstractDistCalc.py +103 -103
AeroViz/process/script/Chemical.py +168 -167
AeroViz/process/script/IMPACT.py +40 -40
AeroViz/process/script/IMPROVE.py +152 -152
AeroViz/process/script/Others.py +45 -45
AeroViz/process/script/PSD.py +26 -26
AeroViz/process/script/PSD_dry.py +69 -70
AeroViz/process/script/retrieve_RI.py +50 -51
AeroViz/rawDataReader/__init__.py +53 -58
AeroViz/rawDataReader/config/supported_instruments.py +155 -0
AeroViz/rawDataReader/core/__init__.py +233 -356
AeroViz/rawDataReader/script/AE33.py +17 -18
AeroViz/rawDataReader/script/AE43.py +18 -21
AeroViz/rawDataReader/script/APS_3321.py +30 -30
AeroViz/rawDataReader/script/Aurora.py +23 -24
AeroViz/rawDataReader/script/BC1054.py +36 -40
AeroViz/rawDataReader/script/EPA_vertical.py +37 -9
AeroViz/rawDataReader/script/GRIMM.py +16 -23
AeroViz/rawDataReader/script/IGAC.py +90 -0
AeroViz/rawDataReader/script/MA350.py +32 -39
AeroViz/rawDataReader/script/Minion.py +103 -0
AeroViz/rawDataReader/script/NEPH.py +69 -74
AeroViz/rawDataReader/script/SMPS_TH.py +25 -25
AeroViz/rawDataReader/script/SMPS_aim11.py +32 -32
AeroViz/rawDataReader/script/SMPS_genr.py +31 -31
AeroViz/rawDataReader/script/Sunset_OCEC.py +60 -0
AeroViz/rawDataReader/script/TEOM.py +30 -28
AeroViz/rawDataReader/script/Table.py +13 -14
AeroViz/rawDataReader/script/VOC.py +26 -0
AeroViz/rawDataReader/script/__init__.py +18 -20
AeroViz/tools/database.py +64 -66
AeroViz/tools/dataclassifier.py +106 -106
AeroViz/tools/dataprinter.py +51 -51
AeroViz/tools/datareader.py +38 -38
{AeroViz-0.1.3.dist-info → AeroViz-0.1.4.dist-info}/METADATA +5 -4
AeroViz-0.1.4.dist-info/RECORD +112 -0
AeroViz/plot/improve/__init__.py +0 -1
AeroViz/plot/improve/improve.py +0 -240
AeroViz/plot/optical/aethalometer.py +0 -77
AeroViz/plot/templates/event_evolution.py +0 -65
AeroViz/plot/templates/regression.py +0 -256
AeroViz/plot/templates/scatter.py +0 -130
AeroViz/plot/templates/templates.py +0 -398
AeroViz/plot/utils/_decorator.py +0 -74
AeroViz/rawDataReader/script/IGAC_TH.py +0 -104
AeroViz/rawDataReader/script/IGAC_ZM.py +0 -90
AeroViz/rawDataReader/script/OCEC_LCRES.py +0 -34
AeroViz/rawDataReader/script/OCEC_RES.py +0 -28
AeroViz/rawDataReader/script/VOC_TH.py +0 -30
AeroViz/rawDataReader/script/VOC_ZM.py +0 -37
AeroViz/rawDataReader/utils/__init__.py +0 -0
AeroViz/rawDataReader/utils/config.py +0 -169
AeroViz-0.1.3.dist-info/RECORD +0 -111
/AeroViz/{config → data}/DEFAULT_PNSD_DATA.csv +0 -0
/AeroViz/{config → rawDataReader/config}/__init__.py +0 -0
{AeroViz-0.1.3.dist-info → AeroViz-0.1.4.dist-info}/LICENSE +0 -0
{AeroViz-0.1.3.dist-info → AeroViz-0.1.4.dist-info}/WHEEL +0 -0
{AeroViz-0.1.3.dist-info → AeroViz-0.1.4.dist-info}/top_level.txt +0 -0

AeroViz/rawDataReader/script/NEPH.py CHANGED Viewed

@@ -4,77 +4,72 @@ from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'NEPH'
-	def _raw_reader(self, _file):
-		with _file.open('r', encoding='utf-8', errors='ignore') as f:
-			_df = read_csv(f, header=None, names=range(11))
-			_df_grp = _df.groupby(0)
-			# T : time
-			_df_tm = _df_grp.get_group('T')[[1, 2, 3, 4, 5, 6]].astype(int)
-			for _k in [2, 3, 4, 5, 6]:
-				_df_tm[_k] = _df_tm[_k].astype(int).map('{:02d}'.format).copy()
-			_df_tm = _df_tm.astype(str)
-			_idx_tm = to_datetime((_df_tm[1] + _df_tm[2] + _df_tm[3] + _df_tm[4] + _df_tm[5] + _df_tm[6]),
-								  format='%Y%m%d%H%M%S')
-			# D : data
-			# col : 3~8 B G R BB BG BR
-			# 1e6
-			try:
-				_df_dt = _df_grp.get_group('D')[[1, 2, 3, 4, 5, 6, 7, 8]].set_index(_idx_tm)
-				_df_out = (_df_dt.groupby(1).get_group('NBXX')[[3, 4, 5, 6, 7, 8]] * 1e6).reindex(_idx_tm)
-				_df_out.columns = ['B', 'G', 'R', 'BB', 'BG', 'BR']
-				_df_out.index.name = 'Time'
-				# Y : state
-				# col : 5 RH
-				_df_st = _df_grp.get_group('Y')
-				_df_out['RH'] = _df_st[5].values
-				_df_out['status'] = _df_st[9].values
-				_df_out.mask(_df_out['status'] != 0)  # 0000 -> numeric to 0
-				return _df_out[['B', 'G', 'R', 'BB', 'BG', 'BR', 'RH']]
-			except ValueError:
-				group_sizes = _df_grp.size()
-				print(group_sizes)
-				# Define the valid groups
-				valid_groups = {'B', 'G', 'R', 'D', 'T', 'Y', 'Z'}
-				# Find the rows where the value in the first column is not in valid_groups
-				invalid_indices = _df[~_df[0].isin(valid_groups)].index
-				# Print the invalid indices and their corresponding values
-				invalid_values = _df.loc[invalid_indices, 0]
-				print("Invalid values and their indices:")
-				for idx, value in zip(invalid_indices, invalid_values):
-					print(f"Index: {idx}, Value: {value}")
-				# If there's a length mismatch, return an empty DataFrame with the same index and column names
-				columns = ['B', 'G', 'R', 'BB', 'BG', 'BR', 'RH']
-				_df_out = DataFrame(index=_idx_tm, columns=columns)
-				_df_out.index.name = 'Time'
-				print(f'\n\t\t\t Length mismatch in {_file} data. Returning an empty DataFrame.')
-				return _df_out
-	# QC data
-	def _QC(self, _df):
-		# remove negative value
-		_df = _df.mask((_df <= 0).copy())
-		# call by _QC function
-		# QC data in 1 hr
-		def _QC_func(_df_1hr):
-			_df_ave = _df_1hr.mean()
-			_df_std = _df_1hr.std()
-			_df_lowb, _df_highb = _df_1hr < (_df_ave - _df_std * 1.5), _df_1hr > (_df_ave + _df_std * 1.5)
-			return _df_1hr.mask(_df_lowb | _df_highb).copy()
-		return _df.resample('1h', group_keys=False).apply(_QC_func)
+    nam = 'NEPH'
+    def _raw_reader(self, _file):
+        with _file.open('r', encoding='utf-8', errors='ignore') as f:
+            _df = read_csv(f, header=None, names=range(11))
+            _df_grp = _df.groupby(0)
+            # T : time
+            _idx_tm = to_datetime(
+                _df_grp.get_group('T')[[1, 2, 3, 4, 5, 6]]
+                .map(lambda x: f"{int(x):02d}")
+                .agg(''.join, axis=1),
+                format='%Y%m%d%H%M%S'
+            )
+            # D : data
+            # col : 3~8 B G R BB BG BR
+            # 1e6
+            try:
+                _df_dt = _df_grp.get_group('D')[[1, 2, 3, 4, 5, 6, 7, 8]].set_index(_idx_tm)
+                try:
+                    _df_out = (_df_dt.groupby(1).get_group('NBXX')[[3, 4, 5, 6, 7, 8]] * 1e6).reindex(_idx_tm)
+                except KeyError:
+                    _df_out = (_df_dt.groupby(1).get_group('NTXX')[[3, 4, 5, 6, 7, 8]] * 1e6).reindex(_idx_tm)
+                _df_out.columns = ['B', 'G', 'R', 'BB', 'BG', 'BR']
+                _df_out.index.name = 'Time'
+                # Y : state
+                # col : 5 RH
+                _df_st = _df_grp.get_group('Y')
+                _df_out['RH'] = _df_st[5].values
+                _df_out['status'] = _df_st[9].values
+                _df_out.mask(_df_out['status'] != 0)  # 0000 -> numeric to 0
+                _df = _df_out[['B', 'G', 'R', 'BB', 'BG', 'BR', 'RH']]
+                return _df.loc[~_df.index.duplicated() & _df.index.notna()]
+            except ValueError:
+                group_sizes = _df_grp.size()
+                print(group_sizes)
+                # Define valid groups and find invalid indices
+                valid_groups = {'B', 'G', 'R', 'D', 'T', 'Y', 'Z'}
+                invalid_indices = _df[~_df[0].isin(valid_groups)].index
+                # Print invalid indices and values
+                print("Invalid values and their indices:")
+                for idx in invalid_indices:
+                    print(f"Index: {idx}, Value: {_df.at[idx, 0]}")
+                # Return an empty DataFrame with specified columns if there's a length mismatch
+                columns = ['B', 'G', 'R', 'BB', 'BG', 'BR', 'RH']
+                _df_out = DataFrame(index=_idx_tm, columns=columns)
+                _df_out.index.name = 'Time'
+                print(f'\n\t\t\t Length mismatch in {_file} data. Returning an empty DataFrame.')
+                return _df_out
+    # QC data
+    def _QC(self, _df):
+        # remove negative value
+        _df = _df.mask((_df <= 5).copy())
+        # QC data in 1h
+        return _df.resample('1h').apply(self.basic_QC).resample(self.meta.get("freq")).mean()

AeroViz/rawDataReader/script/SMPS_TH.py CHANGED Viewed

@@ -4,38 +4,38 @@ from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'SMPS_TH'
+    nam = 'SMPS_TH'
-	def _raw_reader(self, _file):
-		with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
-			_df = read_table(f, skiprows=18, parse_dates={'Time': ['Date', 'Start Time']}).set_index('Time')
-			_key = list(_df.keys()[6:-26])
+    def _raw_reader(self, _file):
+        with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
+            _df = read_table(f, skiprows=18, parse_dates={'Time': ['Date', 'Start Time']}).set_index('Time')
+            _key = list(_df.keys()[6:-26])
-			_newkey = {}
-			for _k in _key:
-				_newkey[_k] = float(_k).__round__(4)
+            _newkey = {}
+            for _k in _key:
+                _newkey[_k] = float(_k).__round__(4)
-			# _newkey['Total Conc.(#/cm)'] = 'total'
-			# _newkey['Mode(nm)']	= 'mode'
+            # _newkey['Total Conc.(#/cm)'] = 'total'
+            # _newkey['Mode(nm)']	= 'mode'
-			_df_idx = to_datetime(_df.index, errors='coerce')
-		return _df[_newkey.keys()].rename(_newkey, axis=1).set_index(_df_idx).loc[_df_idx.dropna()]
+            _df_idx = to_datetime(_df.index, errors='coerce')
+        return _df[_newkey.keys()].rename(_newkey, axis=1).set_index(_df_idx).loc[_df_idx.dropna()]
-	## QC data
-	def _QC(self, _df):
-		import numpy as n
+    # QC data
+    def _QC(self, _df):
+        import numpy as n
-		## mask out the data size lower than 7
-		_df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
-		_df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
-		_df = _df.mask(_df_size < 7)
+        # mask out the data size lower than 7
+        _df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
+        _df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
+        _df = _df.mask(_df_size < 7)
-		## remove total conc. lower than 2000
-		_df = _df.mask(_df['total'] < 2000)
+        # remove total conc. lower than 2000
+        _df = _df.mask(_df['total'] < 2000)
-		## remove the bin over 400 nm which num. conc. larger than 4000
-		_df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
+        # remove the bin over 400 nm which num. conc. larger than 4000
+        _df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
-		_df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
+        _df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
-		return _df[_df.keys()[:-1]]
+        return _df[_df.keys()[:-1]]

AeroViz/rawDataReader/script/SMPS_aim11.py CHANGED Viewed

@@ -4,48 +4,48 @@ from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'SMPS_aim11'
+    nam = 'SMPS_aim11'
-	def _raw_reader(self, _file):
-		with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
+    def _raw_reader(self, _file):
+        with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
-			skiprows = 0
-			for _line in f:
+            skiprows = 0
+            for _line in f:
-				if _line.split(',')[0] == 'Scan Number':
-					f.seek(0)
-					break
+                if _line.split(',')[0] == 'Scan Number':
+                    f.seek(0)
+                    break
-				skiprows += 1
-			# breakpoint()
-			_df = read_csv(f, skiprows=skiprows)
-			_tm_idx = to_datetime(_df['DateTime Sample Start'], format='%d/%m/%Y %X', errors='coerce')
+                skiprows += 1
+            # breakpoint()
+            _df = read_csv(f, skiprows=skiprows)
+            _tm_idx = to_datetime(_df['DateTime Sample Start'], format='%d/%m/%Y %X', errors='coerce')
-			## index
-			_df = _df.set_index(_tm_idx).loc[_tm_idx.dropna()]
+            # index
+            _df = _df.set_index(_tm_idx).loc[_tm_idx.dropna()]
-			## keys
-			_key = to_numeric(_df.keys(), errors='coerce')
-			_df.columns = _key
-			_df = _df.loc[:, ~_key.isna()]
+            # keys
+            _key = to_numeric(_df.keys(), errors='coerce')
+            _df.columns = _key
+            _df = _df.loc[:, ~_key.isna()]
-		return _df.apply(to_numeric, errors='coerce')
+        return _df.apply(to_numeric, errors='coerce')
-	## QC data
-	def _QC(self, _df):
-		import numpy as n
+    # QC data
+    def _QC(self, _df):
+        import numpy as n
-		## mask out the data size lower than 7
-		_df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
-		_df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
-		_df = _df.mask(_df_size < 7)
+        # mask out the data size lower than 7
+        _df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
+        _df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
+        _df = _df.mask(_df_size < 7)
-		## remove total conc. lower than 2000
-		_df = _df.mask(_df['total'] < 2000)
+        # remove total conc. lower than 2000
+        _df = _df.mask(_df['total'] < 2000)
-		## remove the bin over 400 nm which num. conc. larger than 4000
-		_df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
+        # remove the bin over 400 nm which num. conc. larger than 4000
+        _df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
-		_df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
+        _df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
-		return _df[_df.keys()[:-1]]
+        return _df[_df.keys()[:-1]]

AeroViz/rawDataReader/script/SMPS_genr.py CHANGED Viewed

@@ -4,48 +4,48 @@ from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'SMPS_genr'
+    nam = 'SMPS_genr'
-	def _raw_reader(self, _file):
-		with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
+    def _raw_reader(self, _file):
+        with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
-			skiprows = 0
-			for _line in f:
+            skiprows = 0
+            for _line in f:
-				if _line.split('\t')[0] == 'Sample #':
-					f.seek(0)
-					break
+                if _line.split('\t')[0] == 'Sample #':
+                    f.seek(0)
+                    break
-				skiprows += 1
+                skiprows += 1
-			_df = read_table(f, skiprows=skiprows)
-			_tm_idx = to_datetime(_df['Date'] + _df['Start Time'], format='%m/%d/%y%X', errors='coerce')
+            _df = read_table(f, skiprows=skiprows)
+            _tm_idx = to_datetime(_df['Date'] + _df['Start Time'], format='%m/%d/%y%X', errors='coerce')
-			## index
-			_df = _df.set_index(_tm_idx).loc[_tm_idx.dropna()]
+            # index
+            _df = _df.set_index(_tm_idx).loc[_tm_idx.dropna()]
-			## keys
-			_key = to_numeric(_df.keys(), errors='coerce')
-			_df.columns = _key
-			_df = _df.loc[:, ~_key.isna()]
+            # keys
+            _key = to_numeric(_df.keys(), errors='coerce')
+            _df.columns = _key
+            _df = _df.loc[:, ~_key.isna()]
-		return _df.apply(to_numeric, errors='coerce')
+        return _df.apply(to_numeric, errors='coerce')
-	## QC data
-	def _QC(self, _df):
-		import numpy as n
+    # QC data
+    def _QC(self, _df):
+        import numpy as n
-		## mask out the data size lower than 7
-		_df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
-		_df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
-		_df = _df.mask(_df_size < 7)
+        # mask out the data size lower than 7
+        _df['total'] = _df.sum(axis=1, min_count=1) * (n.diff(n.log(_df.keys().to_numpy(float)))).mean()
+        _df_size = _df['total'].dropna().resample('1h').size().resample(_df.index.freq).ffill()
+        _df = _df.mask(_df_size < 7)
-		## remove total conc. lower than 2000
-		_df = _df.mask(_df['total'] < 2000)
+        # remove total conc. lower than 2000
+        _df = _df.mask(_df['total'] < 2000)
-		## remove the bin over 400 nm which num. conc. larger than 4000
-		_df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
+        # remove the bin over 400 nm which num. conc. larger than 4000
+        _df_remv_ky = _df.keys()[:-2][_df.keys()[:-2] >= 400.]
-		_df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
+        _df[_df_remv_ky] = _df[_df_remv_ky].copy().mask(_df[_df_remv_ky] > 4000.)
-		return _df[_df.keys()[:-1]]
+        return _df[_df.keys()[:-1]]

AeroViz/rawDataReader/script/Sunset_OCEC.py ADDED Viewed

@@ -0,0 +1,60 @@
+from pandas import to_datetime, read_csv
+from AeroViz.rawDataReader.core import AbstractReader
+class Reader(AbstractReader):
+    nam = 'Sunset_OCEC'
+    def _raw_reader(self, _file):
+        with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
+            _df = read_csv(f, skiprows=3)
+            _df['Start Date/Time'] = _df['Start Date/Time'].str.strip()
+            _df['time'] = to_datetime(_df['Start Date/Time'], format='%m/%d/%Y %I:%M:%S %p', errors='coerce')
+            _df = _df.set_index('time')
+            _df = _df.rename(columns={
+                'Thermal/Optical OC (ugC/LCm^3)': 'Thermal_OC',
+                'OC ugC/m^3 (Thermal/Optical)': 'Thermal_OC',
+                'Thermal/Optical EC (ugC/LCm^3)': 'Thermal_EC',
+                'EC ugC/m^3 (Thermal/Optical)': 'Thermal_EC',
+                'OC=TC-BC (ugC/LCm^3)': 'Optical_OC',
+                'OC by diff ugC (TC-OptEC)': 'Optical_OC',
+                'BC (ugC/LCm^3)': 'Optical_EC',
+                'OptEC ugC/m^3': 'Optical_EC',
+                'Sample Volume Local Condition Actual m^3': 'Sample_Volume',
+                'TC (ugC/LCm^3)': 'TC',
+                'TC ugC/m^3': 'TC',
+                'OCPk1-ug C': 'OC1',
+                'OCPk2-ug C': 'OC2',
+                'OCPk3-ug C': 'OC3',
+                'OCPk4-ug C': 'OC4',
+                'Pyrolized C ug': 'PC'
+            })
+            _df = _df[['Thermal_OC', 'Optical_OC', 'Thermal_EC', 'Optical_EC', 'TC', 'OC1', 'OC2', 'OC3', 'OC4']]
+            return _df.loc[~_df.index.duplicated() & _df.index.notna()]
+    # QC data
+    def _QC(self, _df):
+        import numpy as np
+        _df = _df.where(_df > 0)
+        thresholds = {
+            'Thermal_OC': 0.3,
+            'Optical_OC': 0.3,
+            'Thermal_EC': 0.015,
+            'Optical_EC': 0.015
+        }
+        for col, thresh in thresholds.items():
+            _df.loc[_df[col] <= thresh, col] = np.nan
+        return _df

AeroViz/rawDataReader/script/TEOM.py CHANGED Viewed

@@ -4,43 +4,45 @@ from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'TEOM'
+    nam = 'TEOM'
-	def _raw_reader(self, _file):
-		with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
-			_df = read_csv(f, skiprows=3, index_col=False)
+    def _raw_reader(self, _file):
+        with open(_file, 'r', encoding='utf-8', errors='ignore') as f:
+            _df = read_csv(f, skiprows=3, index_col=False)
-			_df = _df.rename(columns={'Time Stamp': 'time',
-									  'System status': 'status',
-									  'PM-2.5 base MC': 'PM_NV',
-									  'PM-2.5 MC': 'PM_Total',
-									  'PM-2.5 TEOM noise': 'noise', })
+            _df = _df.rename(columns={'Time Stamp': 'time',
+                                      'System status': 'status',
+                                      'PM-2.5 base MC': 'PM_NV',
+                                      'PM-2.5 MC': 'PM_Total',
+                                      'PM-2.5 TEOM noise': 'noise', })
-			_time_replace = {'十一月': '11', '十二月': '12', '一月': '01', '二月': '02', '三月': '03', '四月': '04',
-							 '五月': '05', '六月': '06', '七月': '07', '八月': '08', '九月': '09', '十月': '10'}
+            _time_replace = {'十一月': '11', '十二月': '12', '一月': '01', '二月': '02', '三月': '03', '四月': '04',
+                             '五月': '05', '六月': '06', '七月': '07', '八月': '08', '九月': '09', '十月': '10'}
-			_tm_idx = _df.time
-			for _ori, _rpl in _time_replace.items():
-				_tm_idx = _tm_idx.str.replace(_ori, _rpl)
+            _tm_idx = _df.time
+            for _ori, _rpl in _time_replace.items():
+                _tm_idx = _tm_idx.str.replace(_ori, _rpl)
-			_df = _df.set_index(to_datetime(_tm_idx, errors='coerce', format='%d - %m - %Y %X'))
+            _df = _df.set_index(to_datetime(_tm_idx, errors='coerce', format='%d - %m - %Y %X'))
-			_df = _df.where(_df['status'] < 1e-7)
+            _df = _df.where(_df['status'] < 1e-7)
-		return _df[['PM_NV', 'PM_Total', 'noise', ]]
+        _df = _df[['PM_NV', 'PM_Total', 'noise', ]]
-	## QC data
-	def _QC(self, _df):
+        return _df.loc[~_df.index.duplicated() & _df.index.notna()]
-		_df_idx = _df.index.copy()
+    # QC data
+    def _QC(self, _df):
-		## remove negative value
-		_df = _df.where(_df.noise < 0.01)[['PM_NV', 'PM_Total']].mask((_df < 0).copy())
+        _df_idx = _df.index.copy()
-		## QC data in 1 hr
-		## remove data where size < 8 in 1-hr
-		for _key in ['PM_Total', 'PM_NV']:
-			_size = _df[_key].dropna().resample('1h').size().reindex(_df_idx).ffill().copy()
-			_df[_key] = _df[_key].mask(_size < 8)
+        # remove negative value
+        _df = _df.where(_df.noise < 0.01)[['PM_NV', 'PM_Total']].mask((_df <= 0).copy())
-		return _df.reindex(_df_idx)
+        # QC data in 1 hr
+        # remove data where size < 8 in 1-hr
+        for _key in ['PM_Total', 'PM_NV']:
+            _size = _df[_key].dropna().resample('1h').size().reindex(_df_idx).ffill().copy()
+            _df[_key] = _df[_key].mask(_size < 8)
+        return _df.reindex(_df_idx)

AeroViz/rawDataReader/script/Table.py CHANGED Viewed

@@ -1,28 +1,27 @@
 # read meteorological data from google sheet
 from pandas import read_csv, to_datetime
 from AeroViz.rawDataReader.core import AbstractReader
 class Reader(AbstractReader):
-	nam = 'Table'
-	def _raw_reader(self, _file):
-		self.meta['freq'] = self._oth_set.get('data_freq') or self.meta['freq']
+    nam = 'Table'
-		with (_file).open('r', encoding='utf-8-sig', errors='ignore') as f:
-			_df = read_csv(f, low_memory=False, index_col=0)
+    def _raw_reader(self, _file):
+        with _file.open('r', encoding='utf-8-sig', errors='ignore') as f:
+            _df = read_csv(f, low_memory=False, index_col=0)
-			_df.index = to_datetime(_df.index, errors='coerce', format=self._oth_set.get('date_format') or 'mixed')
-			_df.index.name = 'time'
+            _df.index = to_datetime(_df.index, errors='coerce', format=self._oth_set.get('date_format') or 'mixed')
+            _df.index.name = 'time'
-			_df.columns = _df.keys().str.strip(' ')
+            _df.columns = _df.keys().str.strip(' ')
-			_df = _df.loc[_df.index.dropna()].copy()
+        return _df.loc[~_df.index.duplicated() & _df.index.notna()]
-		return _df.loc[~_df.index.duplicated()]
+    def _QC(self, _df):
+        # remove negative value
+        _df = _df.mask((_df < 0).copy())
-	def _QC(self, _df):
-		return _df
+        # QC data in 6h
+        return _df.resample('6h').apply(self.basic_QC).resample(self.meta.get("freq")).mean()

AeroViz/rawDataReader/script/VOC.py ADDED Viewed

@@ -0,0 +1,26 @@
+from pandas import read_csv
+from AeroViz.rawDataReader.core import AbstractReader
+class Reader(AbstractReader):
+    nam = 'VOC'
+    def _raw_reader(self, _file):
+        with _file.open('r', encoding='utf-8-sig', errors='ignore') as f:
+            _df = read_csv(f, parse_dates=[0], index_col=[0], na_values=('-', 'N.D.'))
+            _df.columns = _df.keys().str.strip(' ')
+            _df.index.name = 'time'
+            try:
+                _df = _df[self.meta["key"]].loc[_df.index.dropna()]
+            except KeyError:
+                _df = _df[self.meta["key_2"]].loc[_df.index.dropna()]
+        return _df.loc[~_df.index.duplicated() & _df.index.notna()]
+    def _QC(self, _df):
+        return _df

AeroViz/rawDataReader/script/__init__.py CHANGED Viewed

@@ -1,22 +1,20 @@
 __all__ = [
-	'NEPH',
-	'Aurora',
-	'Table',
-	'EPA_vertical',
-	'APS_3321',
-	'SMPS_TH',
-	'AE33',
-	'AE43',
-	'BC1054',
-	'MA350',
-	'TEOM',
-	'OCEC_RES',
-	'OCEC_LCRES',
-	'IGAC_TH',
-	'IGAC_ZM',
-	'VOC_TH',
-	'VOC_ZM',
-	'SMPS_genr',
-	'SMPS_aim11',
-	'GRIMM'
+    'NEPH',
+    'Aurora',
+    'SMPS_TH',
+    'SMPS_genr',
+    'SMPS_aim11',
+    'APS_3321',
+    'GRIMM',
+    'AE33',
+    'AE43',
+    'BC1054',
+    'MA350',
+    'TEOM',
+    'Sunset_OCEC',
+    'IGAC',
+    'VOC',
+    'Table',
+    'EPA_vertical',
+    'Minion'
 ]

AeroViz 0.1.3__py3-none-any.whl → 0.1.4__py3-none-any.whl

Potentially problematic release.

AeroViz 0.1.3py3-none-any.whl → 0.1.4py3-none-any.whl