PyPI - xbase-util - Versions diffs - 0.3.8__tar.gz → 0.4.0__tar.gz - Mend

xbase-util 0.3.8tar.gz → 0.4.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

{xbase_util-0.3.8 → xbase_util-0.4.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: xbase_util
-Version: 0.3.8
+Version: 0.4.0
 Summary: 网络安全基础工具
 Home-page: https://gitee.com/jimonik/xbase_util.git
 Author: xyt

{xbase_util-0.3.8 → xbase_util-0.4.0}/setup.py RENAMED Viewed

@@ -3,7 +3,7 @@ from distutils.core import setup
 from setuptools import find_packages
 setup(name="xbase_util",
-      version="0.3.8",
+      version="0.4.0",
       description="网络安全基础工具",
       long_description="包含提取，预测，训练的基础工具",
       author="xyt",

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/add_column_util.py RENAMED Viewed

@@ -128,24 +128,40 @@ def parse_list(x):
     return x
-def handle_dns(origin_list, isDataFrame=False):
-    print("handle_dnslist")
+def handle_dns(origin_list, isDataFrame=False,use_tqdm=False):
     if not isDataFrame:
         origin_list = pd.DataFrame(origin_list)
-    origin_list["dnslist"] = origin_list['dns.host'].apply(parse_list)
-    origin_list['dns_host_is_long_domain'] = origin_list['dnslist'].apply(
-        lambda x: any(is_long_domain(domain) for domain in x))
-    origin_list['dns_host_is_random_characters'] = origin_list['dnslist'].apply(
-        lambda x: any(has_random_characters(domain) for domain in x))
-    origin_list['dns_host_is_special_characters'] = origin_list['dnslist'].apply(
-        lambda x: any(has_special_characters(domain) for domain in x))
-    origin_list['dns_host_is_large_subdomains'] = origin_list['dnslist'].apply(
-        lambda x: any(has_large_number_of_subdomains(domain) for domain in x))
-    origin_list['dns_host_is_danger_domain'] = origin_list['dnslist'].apply(
-        lambda x: any(is_danger_domain(domain) for domain in x))
-    origin_list['dns_host_is_danger_subdomain'] = origin_list['dnslist'].apply(
-        lambda x: any(is_danger_subdomain(domain) for domain in x))
-    origin_list['dns_host_is_uncommon_tld'] = origin_list['dnslist'].apply(
-        lambda x: any(has_uncommon_tld(domain) for domain in x))
+    if use_tqdm:
+        origin_list["dnslist"] = origin_list['dns.host'].progress_apply(parse_list)
+        origin_list['dns_host_is_long_domain'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(is_long_domain(domain) for domain in x))
+        origin_list['dns_host_is_random_characters'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(has_random_characters(domain) for domain in x))
+        origin_list['dns_host_is_special_characters'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(has_special_characters(domain) for domain in x))
+        origin_list['dns_host_is_large_subdomains'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(has_large_number_of_subdomains(domain) for domain in x))
+        origin_list['dns_host_is_danger_domain'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(is_danger_domain(domain) for domain in x))
+        origin_list['dns_host_is_danger_subdomain'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(is_danger_subdomain(domain) for domain in x))
+        origin_list['dns_host_is_uncommon_tld'] = origin_list['dnslist'].progress_apply(
+            lambda x: any(has_uncommon_tld(domain) for domain in x))
+    else:
+        origin_list["dnslist"] = origin_list['dns.host'].apply(parse_list)
+        origin_list['dns_host_is_long_domain'] = origin_list['dnslist'].apply(
+            lambda x: any(is_long_domain(domain) for domain in x))
+        origin_list['dns_host_is_random_characters'] = origin_list['dnslist'].apply(
+            lambda x: any(has_random_characters(domain) for domain in x))
+        origin_list['dns_host_is_special_characters'] = origin_list['dnslist'].apply(
+            lambda x: any(has_special_characters(domain) for domain in x))
+        origin_list['dns_host_is_large_subdomains'] = origin_list['dnslist'].apply(
+            lambda x: any(has_large_number_of_subdomains(domain) for domain in x))
+        origin_list['dns_host_is_danger_domain'] = origin_list['dnslist'].apply(
+            lambda x: any(is_danger_domain(domain) for domain in x))
+        origin_list['dns_host_is_danger_subdomain'] = origin_list['dnslist'].apply(
+            lambda x: any(is_danger_subdomain(domain) for domain in x))
+        origin_list['dns_host_is_uncommon_tld'] = origin_list['dnslist'].apply(
+            lambda x: any(has_uncommon_tld(domain) for domain in x))
     origin_list.drop(columns=['dnslist'], inplace=True)
     return origin_list

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/handle_features_util.py RENAMED Viewed

@@ -8,9 +8,7 @@ from tqdm import tqdm
-def handle_uri(data):
-    tqdm.pandas()
-    print(f"处理URI:{len(data)}")
+def handle_uri(data,use_tqdm=True):
     # 定义正则表达式，确保精确匹配各种攻击特征
     regex_patterns = {
         "sql": re.compile(
@@ -97,14 +95,15 @@ def handle_uri(data):
             result[f"URI_FEATURES_EXTRA_contains_{key}"] = value
         return result
-    feature_data = data.progress_apply(process_row, axis=1, result_type="expand")
+    if use_tqdm:
+        feature_data = data.progress_apply(process_row, axis=1, result_type="expand")
+    else:
+        feature_data = data.apply(process_row, axis=1, result_type="expand")
     data = pd.concat([data, feature_data], axis=1)
     return data
-def handle_ua(data):
-    tqdm.pandas()
-    print("处理UA")
+def handle_ua(data,use_tqdm=True):
     data['http.useragent'] = data['http.useragent'].fillna('').astype(str)
     # 处理换行符及多余空格
     data['http.useragent'] = data['http.useragent'].str.replace(r'\s+', ' ', regex=True)
@@ -157,8 +156,14 @@ def handle_ua(data):
     data['UserAgent_language'] = data['http.useragent'].str.extract(r'\b([a-z]{2}-[A-Z]{2})\b', expand=False,
                                                                     flags=re.IGNORECASE).fillna("Unknown")
     # 统计 User-Agent 中的特殊字符个数
-    data['UserAgent_special_char_count'] = data['http.useragent'].progress_apply(
-        lambda x: len(re.findall(r'[!@#$%^&*\'=:|{}]', x, flags=re.IGNORECASE)))
+    if use_tqdm:
+        data['UserAgent_special_char_count'] = data['http.useragent'].progress_apply(
+            lambda x: len(re.findall(r'[!@#$%^&*\'=:|{}]', x, flags=re.IGNORECASE)))
+    else:
+        data['UserAgent_special_char_count'] = data['http.useragent'].apply(
+            lambda x: len(re.findall(r'[!@#$%^&*\'=:|{}]', x, flags=re.IGNORECASE)))
     # 更新 UserAgent_is_unknown 的计算逻辑
     data['UserAgent_is_unknown'] = data[['UserAgent_browser', 'UserAgent_os', 'UserAgent_platform']].isna().any(
         axis=1).fillna("Unknown")

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/xbase_util.py RENAMED Viewed

@@ -402,16 +402,15 @@ def get_uri_filename_length(uri):
     return 0
-def get_dns_domain_suffix(domain, dns_lock):
-    with dns_lock:
-        try:
-            for tmp_suffix in dns_domain_list:
-                if tmp_suffix in domain:
-                    return tmp_suffix
-            extracted = tldextract.extract(domain)
-            return extracted.suffix
-        except Exception as e:
-            return ""
+def get_dns_domain_suffix(domain):
+    try:
+        for tmp_suffix in dns_domain_list:
+            if tmp_suffix in domain:
+                return tmp_suffix
+        extracted = tldextract.extract(domain)
+        return extracted.suffix
+    except Exception as e:
+        return ""
 def check_path(file_path: str):

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: xbase-util
-Version: 0.3.8
+Version: 0.4.0
 Summary: 网络安全基础工具
 Home-page: https://gitee.com/jimonik/xbase_util.git
 Author: xyt

{xbase_util-0.3.8 → xbase_util-0.4.0}/README.md RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/setup.cfg RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/__init__.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/__init__.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/bean/ConfigBean.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/bean/CurrentConfigBean.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/bean/FlowBean.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/bean/TaskTemplateBean.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/bean/__init__.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/dao/ConfigDao.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/dao/CurrentConfigDao.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/dao/FlowDao.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/dao/TaskTemplateDao.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/dao/__init__.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/db/initsqlite3.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/es_db_util.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/esreq.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/geo_util.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/pcap_util.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util/xbase_constant.py RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util.egg-info/not-zip-safe RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util.egg-info/top_level.txt RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util_assets/GeoLite2-City.mmdb RENAMED Viewed

File without changes

{xbase_util-0.3.8 → xbase_util-0.4.0}/xbase_util_assets/arkimeparse.js RENAMED Viewed

File without changes

xbase-util 0.3.8__tar.gz → 0.4.0__tar.gz

xbase-util 0.3.8tar.gz → 0.4.0tar.gz