PyPI - neverlib - Versions diffs - 0.2.9__py3-none-any.whl → 0.3.0__py3-none-any.whl - Mend

neverlib 0.2.9py3-none-any.whl → 0.3.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (61) hide show

neverlib/Docs/audio_aug/test_volume.ipynb +8 -8
neverlib/Docs/filter/biquad.ipynb +1 -1
neverlib/Docs/filter/filter_family.ipynb +4 -4
neverlib/Docs/vad/VAD_WebRTC.ipynb +4 -4
neverlib/Docs/vad/VAD_whisper.ipynb +2 -2
neverlib/LLM/__init__.py +37 -0
neverlib/LLM/bailian.py +342 -0
neverlib/LLM/image.py +73 -0
neverlib/LLM/text.py +32 -0
neverlib/QA/ImpactNoiseRejection.py +4 -4
neverlib/QA/gen_init.py +13 -16
neverlib/__init__.py +5 -5
neverlib/audio_aug/HarmonicDistortion.py +11 -11
neverlib/audio_aug/__init__.py +54 -0
neverlib/audio_aug/audio_aug.py +18 -18
neverlib/audio_aug/coder_aug.py +25 -25
neverlib/audio_aug/coder_aug2.py +10 -10
neverlib/audio_aug/loss_packet_aug.py +16 -16
neverlib/audio_aug/quant_aug.py +7 -7
neverlib/data_analyze/README.md +1 -1
neverlib/data_analyze/__init__.py +44 -0
neverlib/data_analyze/dataset_analyzer.py +2 -2
neverlib/data_analyze/quality_metrics.py +12 -12
neverlib/data_analyze/statistics.py +1 -1
neverlib/data_analyze/visualization.py +1 -1
neverlib/filter/README.md +3 -3
neverlib/filter/__init__.py +23 -0
neverlib/filter/auto_eq/README.md +2 -2
neverlib/filter/auto_eq/__init__.py +36 -0
neverlib/filter/auto_eq/de_eq.py +1 -1
neverlib/filter/auto_eq/ga_eq_advanced.py +2 -2
neverlib/filter/auto_eq/ga_eq_basic.py +1 -1
neverlib/filter/biquad.py +1 -1
neverlib/metrics/__init__.py +36 -0
neverlib/metrics/dnsmos.py +2 -2
neverlib/metrics/lpc_lsp.py +8 -8
neverlib/metrics/snr.py +5 -5
neverlib/metrics/spec.py +23 -23
neverlib/metrics/test_pesq.py +3 -3
neverlib/tests/__init__.py +17 -0
neverlib/tests/test_imports.py +1 -1
neverlib/utils/README.md +1 -1
neverlib/utils/__init__.py +53 -1
neverlib/utils/audio_split.py +1 -1
neverlib/utils/checkGPU.py +2 -2
neverlib/utils/floder.py +6 -6
neverlib/utils/lazy_expose.py +1 -1
neverlib/utils/lazy_module.py +6 -6
neverlib/utils/message.py +2 -3
neverlib/utils/utils.py +108 -2
neverlib/vad/README.md +5 -5
neverlib/vad/__init__.py +38 -0
neverlib/vad/utils.py +1 -1
{neverlib-0.2.9.dist-info → neverlib-0.3.0.dist-info}/METADATA +3 -3
{neverlib-0.2.9.dist-info → neverlib-0.3.0.dist-info}/RECORD +58 -57
neverlib/QA/impact_noise_rejection.png +0 -0
neverlib/QA/out.pcm +0 -0
neverlib/QA/out.wav +0 -0
{neverlib-0.2.9.dist-info → neverlib-0.3.0.dist-info}/WHEEL +0 -0
{neverlib-0.2.9.dist-info → neverlib-0.3.0.dist-info}/licenses/LICENSE +0 -0
{neverlib-0.2.9.dist-info → neverlib-0.3.0.dist-info}/top_level.txt +0 -0

neverlib/data_analyze/quality_metrics.py CHANGED Viewed

@@ -32,12 +32,12 @@ class QualityAnalyzer:
         Args:
             signal_audio: 含有信号和噪声的音频
-            noise_audio: 纯噪声音频（可选）
-            signal_start: 信号开始位置（当噪声未单独提供时使用）
-            signal_end: 信号结束位置（当噪声未单独提供时使用）
+            noise_audio: 纯噪声音频(可选)
+            signal_start: 信号开始位置(当噪声未单独提供时使用)
+            signal_end: 信号结束位置(当噪声未单独提供时使用)
         Returns:
-            SNR值（dB）
+            SNR值(dB)
         """
         if noise_audio is not None:
             # 如果提供了噪声音频
@@ -72,7 +72,7 @@ class QualityAnalyzer:
         Args:
             audio: 音频信号
-            fundamental_freq: 基频（Hz）, 如果不提供则自动检测
+            fundamental_freq: 基频(Hz), 如果不提供则自动检测
             num_harmonics: 考虑的谐波数量
         Returns:
@@ -127,7 +127,7 @@ class QualityAnalyzer:
             percentile_high: 高百分位数
         Returns:
-            动态范围（dB）
+            动态范围(dB)
         """
         amplitude = np.abs(audio)
         amplitude = amplitude[amplitude > 0]  # 避免log(0)
@@ -148,7 +148,7 @@ class QualityAnalyzer:
         Args:
             audio: 测试音频信号
-            reference_audio: 参考音频信号（可选）
+            reference_audio: 参考音频信号(可选)
         Returns:
             (频率数组, 幅度响应数组)
@@ -187,11 +187,11 @@ class QualityAnalyzer:
     def loudness_range(self, audio: np.ndarray, gate_threshold: float = -70) -> dict:
         """
-        计算响度范围（基于EBU R128标准的简化版本）
+        计算响度范围(基于EBU R128标准的简化版本)
         Args:
             audio: 音频信号
-            gate_threshold: 门限阈值（dB）
+            gate_threshold: 门限阈值(dB)
         Returns:
             响度统计信息字典
@@ -203,7 +203,7 @@ class QualityAnalyzer:
         blocks = []
         for i in range(0, len(audio) - block_size, hop_size):
             block = audio[i:i + block_size]
-            # 简化的响度计算（使用RMS近似）
+            # 简化的响度计算(使用RMS近似)
             rms = np.sqrt(np.mean(block ** 2))
             if rms > 0:
                 loudness = 20 * np.log10(rms)
@@ -235,7 +235,7 @@ class QualityAnalyzer:
             processed: 处理后音频
         Returns:
-            谱失真度（dB）
+            谱失真度(dB)
         """
         # 确保两个信号长度相同
         min_len = min(len(original), len(processed))
@@ -265,7 +265,7 @@ def comprehensive_quality_assessment(audio: np.ndarray, sr: int = 22050,
     Args:
         audio: 待评估音频
         sr: 采样率
-        reference: 参考音频（可选）
+        reference: 参考音频(可选)
     Returns:
         质量评估结果字典

neverlib/data_analyze/statistics.py CHANGED Viewed

@@ -32,7 +32,7 @@ class AudioStatistics:
         Args:
             file_path: 音频文件路径
-            audio_data: 音频数据（如果不提供则从文件加载）
+            audio_data: 音频数据(如果不提供则从文件加载)
         """
         try:
             import librosa

neverlib/data_analyze/visualization.py CHANGED Viewed

@@ -248,7 +248,7 @@ class AudioVisualizer:
                 axes[i].plot(time_axis, feature_values)
                 axes[i].set_ylabel(feature_name)
             else:
-                # 二维特征（如MFCC）
+                # 二维特征(如MFCC)
                 img = axes[i].imshow(feature_values,
                                      aspect='auto',
                                      origin='lower')

neverlib/filter/README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # neverlib.filter
-本项目包含音频滤波器的实现和自动EQ匹配算法, 主要基于 scipy.signal 进行封装和扩展, 提供便捷的音频滤波器设计、处理功能以及智能EQ补偿解决方案。
+本项目包含音频滤波器的实现和自动EQ匹配算法, 主要基于 scipy.signal 进行封装和扩展, 提供便捷的音频滤波器设计、处理功能以及智能EQ补偿解决方案.
 ## 主要功能
@@ -18,7 +18,7 @@
 ### 核心文件说明
 - `filters.py`: 提供 EQFilter 类, 包含多种滤波器的设计和实现
-- `biquad.py`: 二阶节（Biquad）滤波器的实现, 支持逐点处理
+- `biquad.py`: 二阶节(Biquad)滤波器的实现, 支持逐点处理
 - `common.py`: 基础滤波器函数, 提供 numpy/scipy 和 torch 版本
 ### 自动EQ匹配算法 (AudoEQ/)
@@ -64,7 +64,7 @@ output = [biquad.process(x) for x in input_signal]
 对于需要自动EQ匹配的场景, 可以直接运行AudoEQ中的脚本：
 ```bash
-# 快速频谱匹配（推荐入门）
+# 快速频谱匹配(推荐入门)
 cd AudoEQ
 python auto_eq_spectral_direct.py

neverlib/filter/__init__.py CHANGED Viewed

@@ -1,5 +1,15 @@
 # This file is auto-generated. Do NOT edit manually.
 # Generated by neverlib.QA.gen_init
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    # 仅在类型检查时导入, 提供IDE补全支持
+    from .biquad import BiquadFilter
+    from .common import HPFilter, HPFilter_torch, LPFilter
+    from .core import EQFilter, EQ_test, eq_process, eq_process_test
+# 运行时使用懒加载
 from lazy_loader import attach
 __getattr__, __dir__, __all__ = attach(
@@ -15,3 +25,16 @@ __getattr__, __dir__, __all__ = attach(
         "core": ['EQFilter', 'EQ_test', 'eq_process', 'eq_process_test'],
     }
 )
+# 显式声明 __all__ 以便 IDE 识别
+if TYPE_CHECKING:
+    __all__ = [
+        'BiquadFilter',
+        'HPFilter',
+        'HPFilter_torch',
+        'LPFilter',
+        'EQFilter',
+        'EQ_test',
+        'eq_process',
+        'eq_process_test',
+    ]

neverlib/filter/auto_eq/README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # Audio EQ Matching Scripts Collection
-本文件夹包含多种不同算法的音频EQ匹配脚本, 可以自动分析两个音频文件的频谱差异并生成EQ补偿参数。
+本文件夹包含多种不同算法的音频EQ匹配脚本, 可以自动分析两个音频文件的频谱差异并生成EQ补偿参数.
 ## 📁 脚本概览
@@ -162,4 +162,4 @@ SAMPLE_RATE = 16000      # 采样率
 ## 📄 许可证
-本项目仅供学习和研究使用。
+本项目仅供学习和研究使用.

neverlib/filter/auto_eq/__init__.py CHANGED Viewed

@@ -1,5 +1,16 @@
 # This file is auto-generated. Do NOT edit manually.
 # Generated by neverlib.QA.gen_init
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    # 仅在类型检查时导入, 提供IDE补全支持
+    from .de_eq import get_filter_function, match_frequency_response, plot_spectra_comparison
+    from .freq_eq import get_freq_eq
+    from .ga_eq_advanced import EQConfig, EQOptimizer, load_config_from_yaml, main
+    from .ga_eq_basic import custom_mutate, evaluate_individual, generate_active_gene, generate_dbgain_gene, generate_fc_gene, generate_q_gene, generate_type_gene, get_combined_eq_response_db, get_magnitude_spectrum_db, get_single_filter_freq_response_db_from_coeffs, individual_creator, main_ga
+# 运行时使用懒加载
 from lazy_loader import attach
 __getattr__, __dir__, __all__ = attach(
@@ -17,3 +28,28 @@ __getattr__, __dir__, __all__ = attach(
         "ga_eq_basic": ['custom_mutate', 'evaluate_individual', 'generate_active_gene', 'generate_dbgain_gene', 'generate_fc_gene', 'generate_q_gene', 'generate_type_gene', 'get_combined_eq_response_db', 'get_magnitude_spectrum_db', 'get_single_filter_freq_response_db_from_coeffs', 'individual_creator', 'main_ga'],
     }
 )
+# 显式声明 __all__ 以便 IDE 识别
+if TYPE_CHECKING:
+    __all__ = [
+        'get_filter_function',
+        'match_frequency_response',
+        'plot_spectra_comparison',
+        'get_freq_eq',
+        'EQConfig',
+        'EQOptimizer',
+        'load_config_from_yaml',
+        'main',
+        'custom_mutate',
+        'evaluate_individual',
+        'generate_active_gene',
+        'generate_dbgain_gene',
+        'generate_fc_gene',
+        'generate_q_gene',
+        'generate_type_gene',
+        'get_combined_eq_response_db',
+        'get_magnitude_spectrum_db',
+        'get_single_filter_freq_response_db_from_coeffs',
+        'individual_creator',
+        'main_ga',
+    ]

neverlib/filter/auto_eq/de_eq.py CHANGED Viewed

@@ -355,4 +355,4 @@ if __name__ == '__main__':
             print(f"  频段 {i + 1}: 类型={params['filter_type']}, Fc={params['fc']:.1f}, Q={params['Q']:.2f}" +
                   (f", 增益={params['dBgain']:.2f}" if params['dBgain'] is not None else ""))
     else:
-        print("未生成EQ参数或处理中发生错误。")
+        print("未生成EQ参数或处理中发生错误. ")

neverlib/filter/auto_eq/ga_eq_advanced.py CHANGED Viewed

@@ -119,7 +119,7 @@ class EQOptimizer:
     def _setup_deap(self):
         """设置DEAP遗传算法框架"""
-        # 清除之前的注册（如果有的话）
+        # 清除之前的注册(如果有的话)
         if hasattr(creator, "FitnessMin"):
             del creator.FitnessMin
         if hasattr(creator, "Individual"):
@@ -177,7 +177,7 @@ class EQOptimizer:
         return individual,
     def get_magnitude_spectrum_db(self, audio: np.ndarray, sr: int, n_fft: int) -> Tuple[np.ndarray, np.ndarray]:
-        """获取音频的幅度谱（dB）"""
+        """获取音频的幅度谱(dB)"""
         f_spec, t_spec, Sxx_spec = signal.spectrogram(
             audio, fs=sr, nperseg=n_fft, noverlap=n_fft // 4,
             scaling='spectrum', mode='magnitude'

neverlib/filter/auto_eq/ga_eq_basic.py CHANGED Viewed

@@ -204,7 +204,7 @@ def evaluate_individual(individual_chromosome):
     # 调整复杂度惩罚项的计算方式, 使其与误差的量级更相关
     # 例如, 如果误差本身就很大, 那么滤波器的数量惩罚可以相对小一些
-    # 或者, 如果目标EQ形状本身就很复杂（变化剧烈）, 那么多用几个滤波器也是合理的
+    # 或者, 如果目标EQ形状本身就很复杂(变化剧烈), 那么多用几个滤波器也是合理的
     # penalty_scale = 1 + np.mean(np.abs(target_eq_shape_db_global)) # 基于目标EQ形状的平均绝对值
     penalty_scale = np.sum(target_eq_shape_db_global**2) / len(target_eq_shape_db_global) if len(target_eq_shape_db_global) > 0 else 1.0
     if penalty_scale < 1e-3:

neverlib/filter/biquad.py CHANGED Viewed

@@ -28,7 +28,7 @@ class BiquadFilter():
 if __name__ == "__main__":
     # 设计高通滤波器系数
     fs = 16000  # 采样率
-    fc = 70  # 截止频率（Hz）
+    fc = 70  # 截止频率(Hz)
     # 输入信号
     input_signal = [0.5, 0.8, 1.0, 0.7, -0.2, -0.6, -0.8, -0.3, -0.3, -0.3, -0.3]

neverlib/metrics/__init__.py CHANGED Viewed

@@ -1,5 +1,18 @@
 # This file is auto-generated. Do NOT edit manually.
 # Generated by neverlib.QA.gen_init
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    # 仅在类型检查时导入, 提供IDE补全支持
+    from .dnsmos import ComputeScore
+    from .lpc_lsp import framing, lpc_lsp_distance, lpc_to_lsp
+    from .snr import get_snr, get_snr_from_noisy, psnr, seg_snr, si_sdr
+    from .spec import lsd, mcd, sd
+    from .test_pesq import mos2pesq, pesq2mos
+    from .time import dc_offset, mean_rms_amplitude, peak_amplitude, rms_amplitude
+# 运行时使用懒加载
 from lazy_loader import attach
 __getattr__, __dir__, __all__ = attach(
@@ -21,3 +34,26 @@ __getattr__, __dir__, __all__ = attach(
         "time": ['dc_offset', 'mean_rms_amplitude', 'peak_amplitude', 'rms_amplitude'],
     }
 )
+# 显式声明 __all__ 以便 IDE 识别
+if TYPE_CHECKING:
+    __all__ = [
+        'ComputeScore',
+        'framing',
+        'lpc_lsp_distance',
+        'lpc_to_lsp',
+        'get_snr',
+        'get_snr_from_noisy',
+        'psnr',
+        'seg_snr',
+        'si_sdr',
+        'lsd',
+        'mcd',
+        'sd',
+        'mos2pesq',
+        'pesq2mos',
+        'dc_offset',
+        'mean_rms_amplitude',
+        'peak_amplitude',
+        'rms_amplitude',
+    ]

neverlib/metrics/dnsmos.py CHANGED Viewed

@@ -2,8 +2,8 @@
 Author: 凌逆战 | Never
 Date: 2025-08-06 10:00:00
 Description:
-要计算个性化 MOS 分数（干扰说话者受到惩罚），请提供“-p”参数，例如：python dnsmos.py -t ./SampleClips -o sample.csv -p
-要计算常规 MOS 分数，请省略“-p”参数。例如：python dnsmos.py -t ./SampleClips -o sample.csv
+要计算个性化 MOS 分数(干扰说话者受到惩罚), 请提供“-p”参数, 例如：python dnsmos.py -t ./SampleClips -o sample.csv -p
+要计算常规 MOS 分数, 请省略“-p”参数. 例如：python dnsmos.py -t ./SampleClips -o sample.csv
 '''
 import librosa
 import numpy as np

neverlib/metrics/lpc_lsp.py CHANGED Viewed

@@ -7,7 +7,7 @@
   主要组件
   预处理函数:
-  - pre_emphasis(): 预加重滤波，增强高频成分
+  - pre_emphasis(): 预加重滤波, 增强高频成分
   - framing(): 分帧处理并应用汉明窗
   LPC分析:
@@ -16,13 +16,13 @@
   距离计算:
   - lsp_mse(): 计算LSP向量间的均方误差
-  - lpc_lsp_distance(): 主函数，返回平均失真度和逐帧失真列表
+  - lpc_lsp_distance(): 主函数, 返回平均失真度和逐帧失真列表
   技术特点
-  - 使用soundfile读取音频（支持多种格式）
-  - librosa进行LPC分析（替代了自定义算法）
-  - 基于LSP的频域失真测量，对量化误差敏感度更低
+  - 使用soundfile读取音频(支持多种格式)
+  - librosa进行LPC分析(替代了自定义算法)
+  - 基于LSP的频域失真测量, 对量化误差敏感度更低
   - 逐帧分析捕捉语音时变特性
   应用场景
@@ -52,7 +52,7 @@ def framing(signal, frame_size, frame_stride, fs):
 def lpc_to_lsp(a, num_points=512):
     """
-    LPC -> LSP 转换（简易近似版，零点搜索法）
+    LPC -> LSP 转换(简易近似版, 零点搜索法)
     """
     p = len(a) - 1
     a = np.array(a)
@@ -91,7 +91,7 @@ def lpc_lsp_distance(ref_wav, test_wav, frame_size=0.025, frame_stride=0.01, ord
     ref_frames = framing(ref_sig, frame_size, frame_stride, fs_r)
     test_frames = framing(test_sig, frame_size, frame_stride, fs_t)
-    # 对齐帧数（简单切到最短）
+    # 对齐帧数(简单切到最短)
     num_frames = min(len(ref_frames), len(test_frames))
     ref_frames = ref_frames[:num_frames]
     test_frames = test_frames[:num_frames]
@@ -102,7 +102,7 @@ def lpc_lsp_distance(ref_wav, test_wav, frame_size=0.025, frame_stride=0.01, ord
         a_test = librosa.lpc(test_frames[i], order=order)
         lsp_ref = lpc_to_lsp(a_ref)
         lsp_test = lpc_to_lsp(a_test)
-        # 对齐长度（简单裁切）
+        # 对齐长度(简单裁切)
         min_len = min(len(lsp_ref), len(lsp_test))
         # 计算两个 LSP 向量的均方差
         dist = np.mean((lsp_ref[:min_len] - lsp_test[:min_len]) ** 2)

neverlib/metrics/snr.py CHANGED Viewed

@@ -129,15 +129,15 @@ def psnr(clean, noisy, max_val=None):
 def si_sdr(reference, estimate, epsilon=1e-8):
     """
-    计算尺度不变信噪比 (Scale-Invariant Signal-to-Distortion Ratio, SI-SDR)。
+    计算尺度不变信噪比 (Scale-Invariant Signal-to-Distortion Ratio, SI-SDR).
     Args:
-        reference (np.ndarray): 原始的、干净的参考信号 (一维数组)。
-        estimate (np.ndarray): 模型估计或处理后的信号 (一维数组)。
-        epsilon (float): 一个非常小的数值, 用于防止分母为零, 保证数值稳定性。
+        reference (np.ndarray): 原始的、干净的参考信号 (一维数组).
+        estimate (np.ndarray): 模型估计或处理后的信号 (一维数组).
+        epsilon (float): 一个非常小的数值, 用于防止分母为零, 保证数值稳定性.
     Returns:
-        float: SI-SDR 值, 单位为分贝 (dB)。
+        float: SI-SDR 值, 单位为分贝 (dB).
     """
     assert reference.shape == estimate.shape, "reference和estimate的维度不一样"

neverlib/metrics/spec.py CHANGED Viewed

@@ -9,7 +9,7 @@ Description: 音频信号频域客观度量指标计算工具
 2. LSD (Log-Spectral Distance) - 对数谱距离
    - 在对数功率谱域计算信号距离
-   - 更符合人耳听觉特性，常用于语音质量评估
+   - 更符合人耳听觉特性, 常用于语音质量评估
 3. MCD (Mel-Cepstral Distance) - 梅尔倒谱距离
    - 基于MFCC特征的音频相似性度量
@@ -24,16 +24,16 @@ from neverlib.utils import EPS
 def sd(ref_wav, test_wav, n_fft=2048, hop_length=512, win_length=None):
     """
-    计算两个音频信号之间的频谱距离 (Spectral Distance)。
-    该指标衡量两个信号在频域上的差异程度。
+    计算两个音频信号之间的频谱距离 (Spectral Distance).
+    该指标衡量两个信号在频域上的差异程度.
     Args:
         ref_wav (np.ndarray): 参考音频信号 (一维数组)
         test_wav (np.ndarray): 测试音频信号 (一维数组)
-        n_fft (int): FFT点数，决定频率分辨率，默认为2048
-        hop_length (int): 帧移，决定时间分辨率，默认为512
-        win_length (int, optional): 窗长，如果为None则默认为n_fft
+        n_fft (int): FFT点数, 决定频率分辨率, 默认为2048
+        hop_length (int): 帧移, 决定时间分辨率, 默认为512
+        win_length (int, optional): 窗长, 如果为None则默认为n_fft
     Returns:
-        float: 频谱距离值，值越小表示两个信号越相似
+        float: 频谱距离值, 值越小表示两个信号越相似
     """
     assert len(ref_wav) == len(test_wav), "输入信号长度必须相同"
@@ -58,21 +58,21 @@ def sd(ref_wav, test_wav, n_fft=2048, hop_length=512, win_length=None):
 def lsd(ref_wav, test_wav, n_fft=2048, hop_length=512, win_length=None):
     """
-    计算两个一维音频信号之间的对数谱距离 (Log-Spectral Distance, LSD)。
-    该实现遵循标准的LSD定义: 整体均方根误差。
+    计算两个一维音频信号之间的对数谱距离 (Log-Spectral Distance, LSD).
+    该实现遵循标准的LSD定义: 整体均方根误差.
     Args:
-        ref_wav (np.ndarray): 原始的、干净的参考信号 (一维数组)。
-        test_wav (np.ndarray): 模型估计或处理后的信号 (一维数组)。
-        n_fft (int): FFT点数, 决定了频率分辨率。
-        hop_length (int): 帧移, 决定了时间分辨率。
-        win_length (int, optional): 窗长。如果为None, 则默认为n_fft。
-        epsilon (float): 一个非常小的数值, 用于防止对零取对数, 保证数值稳定性。
+        ref_wav (np.ndarray): 原始的、干净的参考信号 (一维数组).
+        test_wav (np.ndarray): 模型估计或处理后的信号 (一维数组).
+        n_fft (int): FFT点数, 决定了频率分辨率.
+        hop_length (int): 帧移, 决定了时间分辨率.
+        win_length (int, optional): 窗长. 如果为None, 则默认为n_fft.
+        epsilon (float): 一个非常小的数值, 用于防止对零取对数, 保证数值稳定性.
     Returns:
-        float: 对数谱距离值, 单位为分贝 (dB)。
+        float: 对数谱距离值, 单位为分贝 (dB).
     """
-    assert ref_wav.ndim == 1 and test_wav.ndim == 1, "输入信号必须是一维数组。"
+    assert ref_wav.ndim == 1 and test_wav.ndim == 1, "输入信号必须是一维数组. "
     if win_length is None:
         win_length = n_fft
@@ -100,17 +100,17 @@ def lsd(ref_wav, test_wav, n_fft=2048, hop_length=512, win_length=None):
 def mcd(ref_wav, test_wav, sr=16000, n_mfcc=13):
     """
-    计算两个音频信号之间的梅尔倒谱距离 (Mel-Cepstral Distance, MCD)。
-    该指标常用于语音合成质量评估，值越小表示两个信号越相似。
+    计算两个音频信号之间的梅尔倒谱距离 (Mel-Cepstral Distance, MCD).
+    该指标常用于语音合成质量评估, 值越小表示两个信号越相似.
     Args:
         ref_wav (np.ndarray): 参考音频信号 (一维数组)
         test_wav (np.ndarray): 测试音频信号 (一维数组)
-        sr (int): 采样率，默认为16000Hz
-        n_mfcc (int): MFCC系数个数，默认为13
+        sr (int): 采样率, 默认为16000Hz
+        n_mfcc (int): MFCC系数个数, 默认为13
     Returns:
-        float: 梅尔倒谱距离值，值越小表示两个信号越相似
+        float: 梅尔倒谱距离值, 值越小表示两个信号越相似
     """
     assert len(ref_wav) == len(test_wav), "输入信号长度必须相同"
@@ -119,7 +119,7 @@ def mcd(ref_wav, test_wav, sr=16000, n_mfcc=13):
     ref_mfcc = librosa.feature.mfcc(y=ref_wav, sr=sr, n_mfcc=n_mfcc)
     test_mfcc = librosa.feature.mfcc(y=test_wav, sr=sr, n_mfcc=n_mfcc)
-    # 计算MCD (跳过0阶系数，因为0阶主要表示能量)
+    # 计算MCD (跳过0阶系数, 因为0阶主要表示能量)
     diff = ref_mfcc[1:] - test_mfcc[1:]
     mcd_value = (10.0 / np.log(10)) * np.sqrt(
         2 * np.mean(np.sum(diff**2, axis=0)))

neverlib/metrics/test_pesq.py CHANGED Viewed

@@ -3,7 +3,7 @@ Author: 凌逆战 | Never
 Date: 2025-08-05 23:37:31
 Description:
-PESQ 包含 3 种类型的值：NB PESQ MOS、NB MOS LQO、WB MOS LQO。此包仅返回NB PESQ MOS代表 的Raw MOS分数narrowband handset listening。
+PESQ 包含 3 种类型的值：NB PESQ MOS、NB MOS LQO、WB MOS LQO. 此包仅返回NB PESQ MOS代表 的Raw MOS分数narrowband handset listening.
 '''
 import pesq
 import pypesq
@@ -21,11 +21,11 @@ print(pypesq.pesq(clean, enhance, fs=fs))  # 3.817176103591919
 def pesq2mos(pesq):
-    """ 将PESQ值[-0.5, 4.5]映射到MOS-LQO得分[1, 4.5]上，映射函数来源于：P.862.1 """
+    """ 将PESQ值[-0.5, 4.5]映射到MOS-LQO得分[1, 4.5]上, 映射函数来源于：P.862.1 """
     return 0.999 + (4.999 - 0.999) / (1 + np.exp(-1.4945 * pesq + 4.6607))
 def mos2pesq(mos):
-    """ 将MOS-LQO得分[1, 4.5]映射到PESQ值[-0.5, 4.5]上，映射函数来源于：P.862.1"""
+    """ 将MOS-LQO得分[1, 4.5]映射到PESQ值[-0.5, 4.5]上, 映射函数来源于：P.862.1"""
     inlog = (4.999 - mos) / (mos - 0.999)
     return (4.6607 - np.log(inlog)) / 1.4945

neverlib/tests/__init__.py CHANGED Viewed

@@ -1,5 +1,14 @@
 # This file is auto-generated. Do NOT edit manually.
 # Generated by neverlib.QA.gen_init
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    # 仅在类型检查时导入, 提供IDE补全支持
+    from .test_preprocess import test_NS_shape, test_pre_emphasis
+    from .test_vad import test_vad2nad
+# 运行时使用懒加载
 from lazy_loader import attach
 __getattr__, __dir__, __all__ = attach(
@@ -14,3 +23,11 @@ __getattr__, __dir__, __all__ = attach(
         "test_vad": ['test_vad2nad'],
     }
 )
+# 显式声明 __all__ 以便 IDE 识别
+if TYPE_CHECKING:
+    __all__ = [
+        'test_NS_shape',
+        'test_pre_emphasis',
+        'test_vad2nad',
+    ]

neverlib/tests/test_imports.py CHANGED Viewed

@@ -11,7 +11,7 @@ import time
 from neverlib.utils import get_path_list
 from neverlib.data_analyze.dataset_analyzer import AudioFileInfo
-# 确保当前目录在Python路径中，以便导入neverlib
+# 确保当前目录在Python路径中, 以便导入neverlib
 # sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
 sys.path.append("../..")
 print("开始测试neverlib导入功能...")

neverlib/utils/README.md CHANGED Viewed

@@ -18,7 +18,7 @@ rsync \
   ```
 并行作业数
-默认情况下，脚本将为计算机上的每个处理器使用 1 个并行作业。 这是由确定的，如果失败，我们将回退到并行作业来传输文件。
+默认情况下, 脚本将为计算机上的每个处理器使用 1 个并行作业.  这是由确定的, 如果失败, 我们将回退到并行作业来传输文件.
 可以通过使用作为脚本的第一个命令行参数来覆盖此行为：```nproc 10 --parallel```
 ```bash
 ./prsync \

neverlib/utils/__init__.py CHANGED Viewed

@@ -1,5 +1,20 @@
 # This file is auto-generated. Do NOT edit manually.
 # Generated by neverlib.QA.gen_init
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    # 仅在类型检查时导入, 提供IDE补全支持
+    from .audio_split import audio_split_VADfunasr, audio_split_VADsilero, audio_split_ffmpeg, audio_split_np, audio_split_pydub, audio_split_random, audio_split_sox
+    from .checkGPU import get_gpu_utilization, get_gpu_utilization2, monitor_gpu_utilization
+    from .floder import change_path, del_empty_folders, get_leaf_folders, rename_files_and_folders
+    from .lazy_expose import attach_and_expose_all
+    from .lazy_module import LazyModule
+    from .message import send_QQEmail, send_QQEmail_with_images
+    from .pcm import pcm2wav, read_pcm, wav2pcm
+    from .utils import DatasetSubfloderSplit, TrainValSplit, TrainValTestSplit, del_duplicate_path, get_audio_segments, get_file_time, get_path_list, log_time, merge_tensorboard, remove_parent_dir_prefix, save_weight_histogram
+# 运行时使用懒加载
 from lazy_loader import attach
 __getattr__, __dir__, __all__ = attach(
@@ -22,6 +37,43 @@ __getattr__, __dir__, __all__ = attach(
         "lazy_module": ['LazyModule'],
         "message": ['send_QQEmail', 'send_QQEmail_with_images'],
         "pcm": ['pcm2wav', 'read_pcm', 'wav2pcm'],
-        "utils": ['DatasetSubfloderSplit', 'TrainValSplit', 'TrainValTestSplit', 'get_audio_segments', 'get_file_time', 'get_path_list', 'save_weight_histogram'],
+        "utils": ['DatasetSubfloderSplit', 'TrainValSplit', 'TrainValTestSplit', 'del_duplicate_path', 'get_audio_segments', 'get_file_time', 'get_path_list', 'log_time', 'merge_tensorboard', 'remove_parent_dir_prefix', 'save_weight_histogram'],
     }
 )
+# 显式声明 __all__ 以便 IDE 识别
+if TYPE_CHECKING:
+    __all__ = [
+        'audio_split_VADfunasr',
+        'audio_split_VADsilero',
+        'audio_split_ffmpeg',
+        'audio_split_np',
+        'audio_split_pydub',
+        'audio_split_random',
+        'audio_split_sox',
+        'get_gpu_utilization',
+        'get_gpu_utilization2',
+        'monitor_gpu_utilization',
+        'change_path',
+        'del_empty_folders',
+        'get_leaf_folders',
+        'rename_files_and_folders',
+        'attach_and_expose_all',
+        'LazyModule',
+        'send_QQEmail',
+        'send_QQEmail_with_images',
+        'pcm2wav',
+        'read_pcm',
+        'wav2pcm',
+        'DatasetSubfloderSplit',
+        'TrainValSplit',
+        'TrainValTestSplit',
+        'del_duplicate_path',
+        'get_audio_segments',
+        'get_file_time',
+        'get_path_list',
+        'log_time',
+        'merge_tensorboard',
+        'remove_parent_dir_prefix',
+        'save_weight_histogram',
+    ]

neverlib/utils/audio_split.py CHANGED Viewed

@@ -170,7 +170,7 @@ def audio_split_pydub(source_dir, target_dir, sr, channel_num, duration, endwith
 def audio_split_random(source_dir, target_dir, min_duration=3, max_duration=10, sr=16000):
     """
-    将音频切割成 3 到 10 秒的多个片段并保存。
+    将音频切割成 3 到 10 秒的多个片段并保存.
     参数:
     - input_audio_path: 输入音频文件路径
     - output_dir: 输出音频文件夹路径

neverlib 0.2.9__py3-none-any.whl → 0.3.0__py3-none-any.whl

neverlib 0.2.9py3-none-any.whl → 0.3.0py3-none-any.whl