PyPI - neverlib - Versions diffs - 0.2.6__py3-none-any.whl → 0.2.7__py3-none-any.whl - Mend

neverlib 0.2.6py3-none-any.whl → 0.2.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (80) hide show

neverlib/.claude/settings.local.json +9 -0
neverlib/Docs/audio_aug/test_volume.ipynb +416 -0
neverlib/Docs/audio_aug_test/test_volume.ipynb +289 -0
neverlib/Docs/filter/biquad.ipynb +129 -0
neverlib/Docs/filter/filter_family.ipynb +450 -0
neverlib/Docs/filter/highpass.ipynb +139 -0
neverlib/Docs/filter/scipy_filter_family.ipynb +110 -0
neverlib/Docs/vad/VAD_Energy.ipynb +167 -0
neverlib/Docs/vad/VAD_Silero.ipynb +325 -0
neverlib/Docs/vad/VAD_WebRTC.ipynb +189 -0
neverlib/Docs/vad/VAD_funasr.ipynb +192 -0
neverlib/Docs/vad/VAD_rvADfast.ipynb +162 -0
neverlib/Docs/vad/VAD_statistics.ipynb +532 -0
neverlib/Docs/vad/VAD_tenVAD.ipynb +292 -0
neverlib/Docs/vad/VAD_vadlib.ipynb +168 -0
neverlib/Docs/vad/VAD_whisper.ipynb +404 -0
neverlib/QA/gen_init.py +117 -0
neverlib/QA/get_fun.py +19 -0
neverlib/__init__.py +21 -4
neverlib/audio_aug/HarmonicDistortion.py +19 -13
neverlib/audio_aug/__init__.py +30 -12
neverlib/audio_aug/audio_aug.py +19 -14
neverlib/audio_aug/clip_aug.py +15 -18
neverlib/audio_aug/coder_aug.py +44 -24
neverlib/audio_aug/coder_aug2.py +54 -37
neverlib/audio_aug/loss_packet_aug.py +7 -7
neverlib/audio_aug/quant_aug.py +19 -17
neverlib/data/000_short_enhance.wav +0 -0
neverlib/data/3956_speech.wav +0 -0
neverlib/data/3956_sweep.wav +0 -0
neverlib/data/vad_example.wav +0 -0
neverlib/data/white.wav +0 -0
neverlib/data/white_EQ.wav +0 -0
neverlib/data/white_matched.wav +0 -0
neverlib/data_analyze/__init__.py +25 -20
neverlib/data_analyze/dataset_analyzer.py +109 -114
neverlib/data_analyze/quality_metrics.py +87 -89
neverlib/data_analyze/rms_distrubution.py +23 -42
neverlib/data_analyze/spectral_analysis.py +43 -46
neverlib/data_analyze/statistics.py +76 -76
neverlib/data_analyze/temporal_features.py +15 -6
neverlib/data_analyze/visualization.py +208 -144
neverlib/filter/__init__.py +17 -20
neverlib/filter/auto_eq/__init__.py +18 -35
neverlib/filter/auto_eq/de_eq.py +0 -2
neverlib/filter/common.py +24 -5
neverlib/metrics/DNSMOS/bak_ovr.onnx +0 -0
neverlib/metrics/DNSMOS/model_v8.onnx +0 -0
neverlib/metrics/DNSMOS/sig.onnx +0 -0
neverlib/metrics/DNSMOS/sig_bak_ovr.onnx +0 -0
neverlib/metrics/__init__.py +23 -0
neverlib/metrics/dnsmos.py +4 -15
neverlib/metrics/pDNSMOS/sig_bak_ovr.onnx +0 -0
neverlib/metrics/pesq_c/PESQ +0 -0
neverlib/metrics/pesq_c/dsp.c +553 -0
neverlib/metrics/pesq_c/dsp.h +138 -0
neverlib/metrics/pesq_c/pesq.h +294 -0
neverlib/metrics/pesq_c/pesqdsp.c +1047 -0
neverlib/metrics/pesq_c/pesqio.c +392 -0
neverlib/metrics/pesq_c/pesqmain.c +610 -0
neverlib/metrics/pesq_c/pesqmod.c +1417 -0
neverlib/metrics/pesq_c/pesqpar.h +297 -0
neverlib/metrics/snr.py +5 -1
neverlib/metrics/spec.py +31 -21
neverlib/metrics/test_pesq.py +0 -4
neverlib/tests/test_imports.py +17 -0
neverlib/utils/__init__.py +26 -15
neverlib/utils/audio_split.py +5 -1
neverlib/utils/checkGPU.py +17 -9
neverlib/utils/lazy_expose.py +29 -0
neverlib/utils/utils.py +40 -12
neverlib/vad/__init__.py +33 -25
neverlib/vad/class_get_speech.py +1 -1
neverlib/vad/class_vad.py +3 -3
neverlib/vad/img.png +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.7.dist-info}/METADATA +1 -1
{neverlib-0.2.6.dist-info → neverlib-0.2.7.dist-info}/RECORD +80 -37
{neverlib-0.2.6.dist-info → neverlib-0.2.7.dist-info}/WHEEL +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.7.dist-info}/licenses/LICENSE +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.7.dist-info}/top_level.txt +0 -0

neverlib/audio_aug/coder_aug2.py CHANGED Viewed

@@ -3,23 +3,23 @@ Author: 凌逆战 | Never
 Date: 2025-07-29 17:57:26
 Description:
 '''
-import numpy as np
-import librosa
-import soundfile as sf
-import subprocess
 import os
 import random
-import io
+import soundfile as sf
+import subprocess
 def check_codec_available(codec):
     """检查指定的编解码器是否在FFmpeg中可用"""
     try:
-        result = subprocess.run(['ffmpeg', '-encoders'], capture_output=True, text=True)
+        result = subprocess.run(['ffmpeg', '-encoders'],
+                                capture_output=True,
+                                text=True)
         return codec in result.stdout
     except:
         return False
 def apply_codec_distortion(wav, sr, codec='libopus', bitrate='24k'):
     """
     使用 FFmpeg 对音频应用指定的编解码器和码率, 以模拟有损压缩失真。
@@ -56,12 +56,15 @@ def apply_codec_distortion(wav, sr, codec='libopus', bitrate='24k'):
         sf.write(input_filename, wav, sr)
         # 2. 构建 FFmpeg 命令
-        command = ['ffmpeg', '-y', '-i', input_filename, '-c:a', codec, '-b:a', bitrate]
+        command = [
+            'ffmpeg', '-y', '-i', input_filename, '-c:a', codec, '-b:a',
+            bitrate
+        ]
         # 3. 为 AMR 编解码器添加重采样参数
         if codec in ['amr_nb', 'amr_wb']:
             command.extend(['-ar', '8000'])  # AMR-NB 需要 8kHz 采样率
         # 4. 为 AAC 指定输出格式 (移除 -f adts, 使用 MP4 容器)
         # if codec == 'aac':
         #     command.extend(['-f', 'adts'])
@@ -69,13 +72,18 @@ def apply_codec_distortion(wav, sr, codec='libopus', bitrate='24k'):
         command.append(output_filename)
         # 执行命令, 并隐藏输出
-        subprocess.run(command, check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
+        subprocess.run(command,
+                       check=True,
+                       stdout=subprocess.PIPE,
+                       stderr=subprocess.PIPE)
         # 4. 将编码后的文件转换回 WAV 格式以便读取
         wav_output = f"temp_final_{codec}_{bitrate}.wav"
-        subprocess.run(['ffmpeg', '-y', '-i', output_filename, wav_output],
-                      check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
+        subprocess.run(['ffmpeg', '-y', '-i', output_filename, wav_output],
+                       check=True,
+                       stdout=subprocess.PIPE,
+                       stderr=subprocess.PIPE)
         # 5. 从 WAV 文件读回失真的音频
         samples = sf.read(wav_output)[0]
@@ -87,32 +95,41 @@ def apply_codec_distortion(wav, sr, codec='libopus', bitrate='24k'):
         return wav
     finally:
         # 6. 清理临时文件
-        for temp_file in [input_filename, output_filename, f"temp_final_{codec}_{bitrate}.wav"]:
+        for temp_file in [
+                input_filename, output_filename,
+                f"temp_final_{codec}_{bitrate}.wav"
+        ]:
             if os.path.exists(temp_file):
                 os.remove(temp_file)
-# --- 使用示例 ---
-wav_path = "/data/never/Desktop/kws_train/QA/wav_data/TIMIT.wav"
-wav, wav_sr = sf.read(wav_path, always_2d=True)
-# 1. 模拟 Opus 编解码器（常用于VoIP, WebRTC）
-print("应用 Opus 编解码器失真...")
-opus_wav = apply_codec_distortion(wav, wav_sr, codec='libopus', bitrate='24k')
-sf.write('augmented_opus.wav', opus_wav, wav_sr)
-# 2. 模拟 AAC 编解码器（常用于流媒体, Apple设备）
-print("应用 AAC 编解码器失真...")
-aac_wav = apply_codec_distortion(wav, wav_sr, codec='aac', bitrate='64k')
-sf.write('augmented_aac.wav', aac_wav, wav_sr)
-# 3. 模拟 AMR-NB 编解码器（常用于传统移动通信）
-# AMR-NB 的码率是固定的几个值之一
-amr_bitrates = ['4.75k', '5.15k', '5.9k', '6.7k', '7.4k', '7.95k', '10.2k', '12.2k']
-chosen_amr_bitrate = random.choice(amr_bitrates)
-print(f"应用 AMR-NB @ {chosen_amr_bitrate} 编解码器失真...")
-amr_wav = apply_codec_distortion(wav, wav_sr, codec='amr_nb', bitrate=chosen_amr_bitrate)
-# 注意：AMR通常是8kHz采样, librosa加载时会自动重采样, 这里我们保持原始sr
-sf.write('augmented_amr.wav', amr_wav, wav_sr)
-print("所有编解码器增强完成！")
+if __name__ == "__main__":
+    # --- 使用示例 ---
+    wav_path = "/data/never/Desktop/kws_train/QA/wav_data/TIMIT.wav"
+    wav, wav_sr = sf.read(wav_path, always_2d=True)
+    # 1. 模拟 Opus 编解码器（常用于VoIP, WebRTC）
+    print("应用 Opus 编解码器失真...")
+    opus_wav = apply_codec_distortion(wav, wav_sr, codec='libopus', bitrate='24k')
+    sf.write('augmented_opus.wav', opus_wav, wav_sr)
+    # 2. 模拟 AAC 编解码器（常用于流媒体, Apple设备）
+    print("应用 AAC 编解码器失真...")
+    aac_wav = apply_codec_distortion(wav, wav_sr, codec='aac', bitrate='64k')
+    sf.write('augmented_aac.wav', aac_wav, wav_sr)
+    # 3. 模拟 AMR-NB 编解码器（常用于传统移动通信）
+    # AMR-NB 的码率是固定的几个值之一
+    amr_bitrates = [
+        '4.75k', '5.15k', '5.9k', '6.7k', '7.4k', '7.95k', '10.2k', '12.2k'
+    ]
+    chosen_amr_bitrate = random.choice(amr_bitrates)
+    print(f"应用 AMR-NB @ {chosen_amr_bitrate} 编解码器失真...")
+    amr_wav = apply_codec_distortion(wav,
+                                     wav_sr,
+                                     codec='amr_nb',
+                                     bitrate=chosen_amr_bitrate)
+    # 注意：AMR通常是8kHz采样, librosa加载时会自动重采样, 这里我们保持原始sr
+    sf.write('augmented_amr.wav', amr_wav, wav_sr)
+    print("所有编解码器增强完成！")

neverlib/audio_aug/loss_packet_aug.py CHANGED Viewed

@@ -18,7 +18,6 @@ Description: 丢包数据增强
 “置零”是在深度学习框架下对“真正丢弃”问题的一种高效、可解的数学建模。 我们牺牲了一点点物理上的真实性, 换来了模型训练的可行性和高效性。
 '''
 import numpy as np
-import random
 import soundfile as sf
@@ -93,11 +92,12 @@ def simulate_packet_loss_vectorized(
     return damaged_wav
-# 生成一个白噪声
-white_noise = np.random.randn(100000).astype(np.float32)
+if __name__ == "__main__":
+    # 生成一个白噪声
+    white_noise = np.random.randn(100000).astype(np.float32)
-# 生成一个损坏的音频
-damaged_audio = simulate_packet_loss_vectorized(white_noise, 16000, loss_rate=0.1, burst_prob=0.5)
+    # 生成一个损坏的音频
+    damaged_audio = simulate_packet_loss_vectorized(white_noise, 16000, loss_rate=0.1, burst_prob=0.5)
-# 保存音频
-sf.write("damaged_audio.wav", damaged_audio, 16000)
+    # 保存音频
+    sf.write("damaged_audio.wav", damaged_audio, 16000)

neverlib/audio_aug/quant_aug.py CHANGED Viewed

@@ -3,13 +3,8 @@ Author: 凌逆战 | Never
 Date: 2025-03-26 22:13:21
 Description:
 '''
-import os
-import sys
 import numpy as np
 import soundfile as sf
-import librosa
-print(librosa.__version__)
 def apply_uniform_quantization(wav, bit_depth=8):
@@ -47,6 +42,13 @@ def apply_mulaw_quantization(wav, bit_depth=8):
     wav (np.ndarray): 输入音频。
     bit_depth (int): 目标模拟的位深度。
     """
+    try:
+        import librosa
+    except ImportError:
+        raise ImportError(
+            "librosa is required for apply_mulaw_quantization(). "
+            "Please install it via `pip install librosa`."
+        )
     # mu 的值决定了量化级别的数量 (mu + 1)
     mu = 2**bit_depth - 1
@@ -61,18 +63,18 @@ def apply_mulaw_quantization(wav, bit_depth=8):
     return expanded_wav
-# --- 使用示例 ---
-wav_path = "/data/never/Desktop/kws_train/QA/wav_data/TIMIT.wav"
-wav, wav_sr = sf.read(wav_path, always_2d=True)
-# 模拟一个 8-bit 的老式数字音频设备
-y_quantized_8bit = apply_uniform_quantization(wav, bit_depth=8)
-sf.write('augmented_quantized_8bit.wav', y_quantized_8bit, wav_sr)
+if __name__ == "__main__":
+    # --- 使用示例 ---
+    wav_path = "/data/never/Desktop/kws_train/QA/wav_data/TIMIT.wav"
+    wav, wav_sr = sf.read(wav_path, always_2d=True)
-# 模拟一个更差的 4-bit 设备
-y_quantized_4bit = apply_uniform_quantization(wav, bit_depth=4)
-sf.write('augmented_quantized_4bit.wav', y_quantized_4bit, wav_sr)
+    # 模拟一个 8-bit 的老式数字音频设备
+    y_quantized_8bit = apply_uniform_quantization(wav, bit_depth=8)
+    sf.write('augmented_quantized_8bit.wav', y_quantized_8bit, wav_sr)
+    # 模拟一个更差的 4-bit 设备
+    y_quantized_4bit = apply_uniform_quantization(wav, bit_depth=4)
+    sf.write('augmented_quantized_4bit.wav', y_quantized_4bit, wav_sr)
-y_q = apply_mulaw_quantization(wav, bit_depth=8)
-sf.write('augmented_mulaw_8bit.wav', y_q, wav_sr)
+    y_q = apply_mulaw_quantization(wav, bit_depth=8)
+    sf.write('augmented_mulaw_8bit.wav', y_q, wav_sr)

neverlib/data/000_short_enhance.wav ADDED Viewed

Binary file

neverlib/data/3956_speech.wav ADDED Viewed

Binary file

neverlib/data/3956_sweep.wav ADDED Viewed

Binary file

neverlib/data/vad_example.wav ADDED Viewed

Binary file

neverlib/data/white.wav ADDED Viewed

Binary file

neverlib/data/white_EQ.wav ADDED Viewed

Binary file

neverlib/data/white_matched.wav ADDED Viewed

Binary file

neverlib/data_analyze/__init__.py CHANGED Viewed

@@ -1,20 +1,25 @@
-'''
-Author: 凌逆战 | Never
-Date: 2025-08-06 00:56:39
-Description:
-'''
-"""
-音频数据分析模块
-Audio Data Analysis Module
-提供完整的音频数据分析功能, 包括特征提取、质量评估、统计分析和可视化等。
-"""
-from lazy_loader import attach
-__getattr__, __dir__, __all__ = attach(
-    __name__,
-    submodules=["temporal_features"],
-    submod_attrs={
-        "temporal_features": ["dB", "peak_amplitude", "rms_amplitude"],
-    },
-)
+# This file is auto-generated. Do NOT edit manually.
+# Generated by neverlib.QA.gen_init
+from lazy_loader import attach
+__getattr__, __dir__, __all__ = attach(
+    __name__,
+    submodules=[
+        "dataset_analyzer",
+        "quality_metrics",
+        "rms_distrubution",
+        "spectral_analysis",
+        "statistics",
+        "temporal_features",
+        "visualization",
+    ],
+    submod_attrs={
+        "dataset_analyzer": ['AudioFileInfo', 'DatasetAnalyzer', 'analyze_audio_dataset'],
+        "quality_metrics": ['QualityAnalyzer', 'audio_health_check', 'comprehensive_quality_assessment'],
+        "rms_distrubution": ['get_rms_vad'],
+        "spectral_analysis": ['SpectralAnalyzer', 'compute_spectral_features', 'frequency_domain_stats'],
+        "statistics": ['AudioStatistics', 'compare_datasets', 'quick_audio_stats'],
+        "temporal_features": ['dB', 'dc_offset', 'max_rms_amplitude', 'mean_rms_amplitude', 'min_rms_amplitude', 'peak_amplitude', 'rms_amplitude', 'short_time_energy', 'zero_crossing_rate'],
+        "visualization": ['AudioVisualizer', 'create_analysis_dashboard', 'plot_dataset_overview'],
+    }
+)

neverlib 0.2.6__py3-none-any.whl → 0.2.7__py3-none-any.whl

neverlib 0.2.6py3-none-any.whl → 0.2.7py3-none-any.whl