PyPI - neverlib - Versions diffs - 0.2.6__py3-none-any.whl → 0.2.8__py3-none-any.whl - Mend

neverlib 0.2.6py3-none-any.whl → 0.2.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (82) hide show

neverlib/.claude/settings.local.json +9 -0
neverlib/Docs/audio_aug/test_volume.ipynb +416 -0
neverlib/Docs/audio_aug_test/test_volume.ipynb +289 -0
neverlib/Docs/filter/biquad.ipynb +129 -0
neverlib/Docs/filter/filter_family.ipynb +450 -0
neverlib/Docs/filter/highpass.ipynb +139 -0
neverlib/Docs/filter/scipy_filter_family.ipynb +110 -0
neverlib/Docs/vad/VAD_Energy.ipynb +167 -0
neverlib/Docs/vad/VAD_Silero.ipynb +325 -0
neverlib/Docs/vad/VAD_WebRTC.ipynb +189 -0
neverlib/Docs/vad/VAD_funasr.ipynb +192 -0
neverlib/Docs/vad/VAD_rvADfast.ipynb +162 -0
neverlib/Docs/vad/VAD_statistics.ipynb +532 -0
neverlib/Docs/vad/VAD_tenVAD.ipynb +292 -0
neverlib/Docs/vad/VAD_vadlib.ipynb +168 -0
neverlib/Docs/vad/VAD_whisper.ipynb +404 -0
neverlib/QA/gen_init.py +218 -0
neverlib/QA/get_fun.py +19 -0
neverlib/__init__.py +40 -4
neverlib/audio_aug/HarmonicDistortion.py +19 -13
neverlib/audio_aug/__init__.py +82 -12
neverlib/audio_aug/audio_aug.py +19 -14
neverlib/audio_aug/clip_aug.py +15 -18
neverlib/audio_aug/coder_aug.py +44 -24
neverlib/audio_aug/coder_aug2.py +54 -37
neverlib/audio_aug/loss_packet_aug.py +7 -7
neverlib/audio_aug/quant_aug.py +19 -17
neverlib/data/000_short_enhance.wav +0 -0
neverlib/data/3956_speech.wav +0 -0
neverlib/data/3956_sweep.wav +0 -0
neverlib/data/vad_example.wav +0 -0
neverlib/data/white.wav +0 -0
neverlib/data/white_EQ.wav +0 -0
neverlib/data/white_matched.wav +0 -0
neverlib/data_analyze/__init__.py +69 -20
neverlib/data_analyze/dataset_analyzer.py +109 -114
neverlib/data_analyze/quality_metrics.py +87 -89
neverlib/data_analyze/rms_distrubution.py +23 -42
neverlib/data_analyze/spectral_analysis.py +43 -46
neverlib/data_analyze/statistics.py +76 -76
neverlib/data_analyze/temporal_features.py +15 -6
neverlib/data_analyze/visualization.py +208 -144
neverlib/filter/__init__.py +40 -20
neverlib/filter/auto_eq/__init__.py +50 -31
neverlib/filter/auto_eq/de_eq.py +0 -2
neverlib/filter/common.py +24 -5
neverlib/metrics/DNSMOS/bak_ovr.onnx +0 -0
neverlib/metrics/DNSMOS/model_v8.onnx +0 -0
neverlib/metrics/DNSMOS/sig.onnx +0 -0
neverlib/metrics/DNSMOS/sig_bak_ovr.onnx +0 -0
neverlib/metrics/__init__.py +59 -0
neverlib/metrics/dnsmos.py +4 -15
neverlib/metrics/pDNSMOS/sig_bak_ovr.onnx +0 -0
neverlib/metrics/pesq_c/PESQ +0 -0
neverlib/metrics/pesq_c/dsp.c +553 -0
neverlib/metrics/pesq_c/dsp.h +138 -0
neverlib/metrics/pesq_c/pesq.h +294 -0
neverlib/metrics/pesq_c/pesqdsp.c +1047 -0
neverlib/metrics/pesq_c/pesqio.c +392 -0
neverlib/metrics/pesq_c/pesqmain.c +610 -0
neverlib/metrics/pesq_c/pesqmod.c +1417 -0
neverlib/metrics/pesq_c/pesqpar.h +297 -0
neverlib/metrics/snr.py +5 -1
neverlib/metrics/spec.py +31 -21
neverlib/metrics/test_pesq.py +0 -4
neverlib/tests/__init__.py +33 -1
neverlib/tests/test_imports.py +19 -0
neverlib/utils/__init__.py +71 -15
neverlib/utils/audio_split.py +6 -1
neverlib/utils/checkGPU.py +17 -9
neverlib/utils/lazy_expose.py +29 -0
neverlib/utils/utils.py +55 -12
neverlib/vad/PreProcess.py +66 -66
neverlib/vad/__init__.py +71 -25
neverlib/vad/class_get_speech.py +1 -1
neverlib/vad/class_vad.py +3 -3
neverlib/vad/img.png +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.8.dist-info}/METADATA +1 -1
{neverlib-0.2.6.dist-info → neverlib-0.2.8.dist-info}/RECORD +82 -39
{neverlib-0.2.6.dist-info → neverlib-0.2.8.dist-info}/WHEEL +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.8.dist-info}/licenses/LICENSE +0 -0
{neverlib-0.2.6.dist-info → neverlib-0.2.8.dist-info}/top_level.txt +0 -0

neverlib/.claude/settings.local.json ADDED Viewed

@@ -0,0 +1,9 @@
+{
+  "permissions": {
+    "allow": [
+      "Read(/data03/never/Desktop/neverlib/**)"
+    ],
+    "deny": [],
+    "ask": []
+  }
+}

neverlib/Docs/audio_aug/test_volume.ipynb ADDED Viewed

@@ -0,0 +1,416 @@
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "f27585eb",
+   "metadata": {},
+   "outputs": [
+    {
+     "ename": "ImportError",
+     "evalue": "cannot import name 'volume_aug_linmax' from 'audio_aug' (unknown location)",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[31m---------------------------------------------------------------------------\u001b[39m",
+      "\u001b[31mImportError\u001b[39m                               Traceback (most recent call last)",
+      "\u001b[36mCell\u001b[39m\u001b[36m \u001b[39m\u001b[32mIn[14]\u001b[39m\u001b[32m, line 5\u001b[39m\n\u001b[32m      2\u001b[39m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01msys\u001b[39;00m\n\u001b[32m      3\u001b[39m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01mos\u001b[39;00m\n\u001b[32m----> \u001b[39m\u001b[32m5\u001b[39m \u001b[38;5;28;01mfrom\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01maudio_aug\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mimport\u001b[39;00m volume_aug_linmax, volume_aug_dbrms, volume_aug_lufs, measure_loudness\n\u001b[32m      6\u001b[39m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01msoundfile\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mas\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01msf\u001b[39;00m\n\u001b[32m      7\u001b[39m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01mnumpy\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mas\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01mnp\u001b[39;00m\n",
+      "\u001b[31mImportError\u001b[39m: cannot import name 'volume_aug_linmax' from 'audio_aug' (unknown location)"
+     ]
+    },
+    {
+     "ename": "",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[1;31mThe Kernel crashed while executing code in the current cell or a previous cell. \n",
+      "\u001b[1;31mPlease review the code in the cell(s) to identify a possible cause of the failure. \n",
+      "\u001b[1;31mClick <a href='https://aka.ms/vscodeJupyterKernelCrash'>here</a> for more info. \n",
+      "\u001b[1;31mView Jupyter <a href='command:jupyter.viewOutput'>log</a> for further details."
+     ]
+    }
+   ],
+   "source": [
+    "# 确保使用本地版本而非安装版本\n",
+    "import sys\n",
+    "import os\n",
+    "\n",
+    "from audio_aug import volume_aug_linmax, volume_aug_dbrms, volume_aug_lufs, measure_loudness\n",
+    "import soundfile as sf\n",
+    "import numpy as np\n",
+    "import matplotlib.pyplot as plt\n",
+    "\n",
+    "# 导入可视化工具\n",
+    "from neverlib.data_analyze.visualization import AudioVisualizer\n",
+    "\n",
+    "wav_path = \"/data03/never/Dataset/kws_data/Command_Word/group_a_class/zh/pos_example/上一首/037/soft_normal_male_25_151_vadstart5920_vadend33600_snr14.2.wav\"\n",
+    "wav, sr = sf.read(wav_path, always_2d=True, dtype=\"float32\")\n",
+    "wav = wav[:, 1]\n",
+    "\n",
+    "# 创建可视化工具\n",
+    "visualizer = AudioVisualizer(sr=sr)\n",
+    "\n",
+    "# 测量原始音频的响度信息\n",
+    "original_loudness = measure_loudness(wav, sr)\n",
+    "print(\"原始音频响度信息:\")\n",
+    "print(f\"峰值: {original_loudness['peak_dbfs']:.2f} dBFS\")\n",
+    "print(f\"RMS: {original_loudness['rms_dbfs']:.2f} dBFS\")\n",
+    "print(f\"LUFS: {original_loudness['lufs']:.2f} LUFS\")\n",
+    "print(f\"峰均比: {original_loudness['crest_factor_db']:.2f} dB\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "f86b2ba1",
+   "metadata": {},
+   "source": [
+    "##  linear 音量增强"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "4585297c",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "wav_linear = volume_aug_linmax(wav, 0.5)\n",
+    "\n",
+    "# 测量处理后的响度\n",
+    "linear_loudness = measure_loudness(wav_linear, sr)\n",
+    "\n",
+    "# 绘制时域和频域图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "\n",
+    "# 波形图\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_waveform(wav, \"原始波形\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_waveform(wav_linear, f\"Linear增强波形 (目标幅度: 0.5)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 频谱图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_spectrogram(wav, \"原始频谱图\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_spectrogram(wav_linear, f\"Linear增强频谱图 (目标幅度: 0.5)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 响度对比\n",
+    "plt.figure(figsize=(10, 6))\n",
+    "labels = ['原始音频', 'Linear增强']\n",
+    "peak_values = [original_loudness['peak_dbfs'], linear_loudness['peak_dbfs']]\n",
+    "rms_values = [original_loudness['rms_dbfs'], linear_loudness['rms_dbfs']]\n",
+    "lufs_values = [original_loudness['lufs'], linear_loudness['lufs']]\n",
+    "\n",
+    "x = np.arange(len(labels))\n",
+    "width = 0.25\n",
+    "\n",
+    "plt.bar(x - width, peak_values, width, label='峰值 (dBFS)')\n",
+    "plt.bar(x, rms_values, width, label='RMS (dBFS)')\n",
+    "plt.bar(x + width, lufs_values, width, label='LUFS')\n",
+    "\n",
+    "plt.ylabel('分贝')\n",
+    "plt.title('Linear音量增强前后响度对比')\n",
+    "plt.xticks(x, labels)\n",
+    "plt.legend()\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "print(f\"Linear增强后响度信息:\")\n",
+    "print(f\"峰值: {linear_loudness['peak_dbfs']:.2f} dBFS (变化: {linear_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:.2f} dB)\")\n",
+    "print(f\"RMS: {linear_loudness['rms_dbfs']:.2f} dBFS (变化: {linear_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:.2f} dB)\")\n",
+    "print(f\"LUFS: {linear_loudness['lufs']:.2f} LUFS (变化: {linear_loudness['lufs'] - original_loudness['lufs']:.2f} dB)\")\n",
+    "print(f\"峰均比: {linear_loudness['crest_factor_db']:.2f} dB\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "56fb9004",
+   "metadata": {},
+   "source": [
+    "## dBrms 音量增强"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "7e88967d",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "wav_dbrms = volume_aug_dbrms(wav, -6)\n",
+    "\n",
+    "# 测量处理后的响度\n",
+    "dbrms_loudness = measure_loudness(wav_dbrms, sr)\n",
+    "\n",
+    "# 绘制时域和频域图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "\n",
+    "# 波形图\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_waveform(wav, \"原始波形\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_waveform(wav_dbrms, f\"dBrms增强波形 (目标电平: -6 dB)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 频谱图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_spectrogram(wav, \"原始频谱图\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_spectrogram(wav_dbrms, f\"dBrms增强频谱图 (目标电平: -6 dB)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 响度对比\n",
+    "plt.figure(figsize=(10, 6))\n",
+    "labels = ['原始音频', 'dBrms增强']\n",
+    "peak_values = [original_loudness['peak_dbfs'], dbrms_loudness['peak_dbfs']]\n",
+    "rms_values = [original_loudness['rms_dbfs'], dbrms_loudness['rms_dbfs']]\n",
+    "lufs_values = [original_loudness['lufs'], dbrms_loudness['lufs']]\n",
+    "\n",
+    "x = np.arange(len(labels))\n",
+    "width = 0.25\n",
+    "\n",
+    "plt.bar(x - width, peak_values, width, label='峰值 (dBFS)')\n",
+    "plt.bar(x, rms_values, width, label='RMS (dBFS)')\n",
+    "plt.bar(x + width, lufs_values, width, label='LUFS')\n",
+    "\n",
+    "plt.ylabel('分贝')\n",
+    "plt.title('dBrms音量增强前后响度对比')\n",
+    "plt.xticks(x, labels)\n",
+    "plt.legend()\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "print(f\"dBrms增强后响度信息:\")\n",
+    "print(f\"峰值: {dbrms_loudness['peak_dbfs']:.2f} dBFS (变化: {dbrms_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:.2f} dB)\")\n",
+    "print(f\"RMS: {dbrms_loudness['rms_dbfs']:.2f} dBFS (变化: {dbrms_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:.2f} dB)\")\n",
+    "print(f\"LUFS: {dbrms_loudness['lufs']:.2f} LUFS (变化: {dbrms_loudness['lufs'] - original_loudness['lufs']:.2f} dB)\")\n",
+    "print(f\"峰均比: {dbrms_loudness['crest_factor_db']:.2f} dB\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "e6a9695f",
+   "metadata": {},
+   "source": [
+    "# lufs音量增强"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "30b21884",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "wav_lufs = volume_aug_lufs(wav, -16)\n",
+    "\n",
+    "# 测量处理后的响度\n",
+    "lufs_loudness = measure_loudness(wav_lufs, sr)\n",
+    "\n",
+    "# 绘制时域和频域图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "\n",
+    "# 波形图\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_waveform(wav, \"原始波形\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_waveform(wav_lufs, f\"LUFS增强波形 (目标响度: -16 LUFS)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 频谱图\n",
+    "plt.figure(figsize=(16, 8))\n",
+    "plt.subplot(2, 1, 1)\n",
+    "visualizer.plot_spectrogram(wav, \"原始频谱图\", ax=plt.gca())\n",
+    "plt.subplot(2, 1, 2)\n",
+    "visualizer.plot_spectrogram(wav_lufs, f\"LUFS增强频谱图 (目标响度: -16 LUFS)\", ax=plt.gca())\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 响度对比\n",
+    "plt.figure(figsize=(10, 6))\n",
+    "labels = ['原始音频', 'LUFS增强']\n",
+    "peak_values = [original_loudness['peak_dbfs'], lufs_loudness['peak_dbfs']]\n",
+    "rms_values = [original_loudness['rms_dbfs'], lufs_loudness['rms_dbfs']]\n",
+    "lufs_values = [original_loudness['lufs'], lufs_loudness['lufs']]\n",
+    "\n",
+    "x = np.arange(len(labels))\n",
+    "width = 0.25\n",
+    "\n",
+    "plt.bar(x - width, peak_values, width, label='峰值 (dBFS)')\n",
+    "plt.bar(x, rms_values, width, label='RMS (dBFS)')\n",
+    "plt.bar(x + width, lufs_values, width, label='LUFS')\n",
+    "\n",
+    "plt.ylabel('分贝')\n",
+    "plt.title('LUFS音量增强前后响度对比')\n",
+    "plt.xticks(x, labels)\n",
+    "plt.legend()\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "print(f\"LUFS增强后响度信息:\")\n",
+    "print(f\"峰值: {lufs_loudness['peak_dbfs']:.2f} dBFS (变化: {lufs_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:.2f} dB)\")\n",
+    "print(f\"RMS: {lufs_loudness['rms_dbfs']:.2f} dBFS (变化: {lufs_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:.2f} dB)\")\n",
+    "print(f\"LUFS: {lufs_loudness['lufs']:.2f} LUFS (变化: {lufs_loudness['lufs'] - original_loudness['lufs']:.2f} dB)\")\n",
+    "print(f\"峰均比: {lufs_loudness['crest_factor_db']:.2f} dB\")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "k6vath03xyg",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# 创建三种增强方法的综合对比图\n",
+    "plt.figure(figsize=(16, 12))\n",
+    "\n",
+    "# 波形对比\n",
+    "plt.subplot(3, 1, 1)\n",
+    "time = np.linspace(0, len(wav) / sr, len(wav))\n",
+    "plt.plot(time, wav, label='原始波形', alpha=0.7)\n",
+    "plt.plot(time, wav_linear, label='Linear增强', alpha=0.7)\n",
+    "plt.plot(time, wav_dbrms, label='dBrms增强', alpha=0.7)\n",
+    "plt.plot(time, wav_lufs, label='LUFS增强', alpha=0.7)\n",
+    "plt.title('三种音量增强方法波形对比')\n",
+    "plt.xlabel('时间 (s)')\n",
+    "plt.ylabel('幅度')\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "plt.legend()\n",
+    "\n",
+    "# 响度对比 - 条形图\n",
+    "plt.subplot(3, 1, 2)\n",
+    "labels = ['原始音频', 'Linear增强', 'dBrms增强', 'LUFS增强']\n",
+    "peak_values = [original_loudness['peak_dbfs'], linear_loudness['peak_dbfs'], \n",
+    "               dbrms_loudness['peak_dbfs'], lufs_loudness['peak_dbfs']]\n",
+    "rms_values = [original_loudness['rms_dbfs'], linear_loudness['rms_dbfs'], \n",
+    "              dbrms_loudness['rms_dbfs'], lufs_loudness['rms_dbfs']]\n",
+    "lufs_values = [original_loudness['lufs'], linear_loudness['lufs'], \n",
+    "               dbrms_loudness['lufs'], lufs_loudness['lufs']]\n",
+    "\n",
+    "x = np.arange(len(labels))\n",
+    "width = 0.25\n",
+    "\n",
+    "plt.bar(x - width, peak_values, width, label='峰值 (dBFS)')\n",
+    "plt.bar(x, rms_values, width, label='RMS (dBFS)')\n",
+    "plt.bar(x + width, lufs_values, width, label='LUFS')\n",
+    "\n",
+    "plt.ylabel('分贝')\n",
+    "plt.title('三种音量增强方法响度对比')\n",
+    "plt.xticks(x, labels)\n",
+    "plt.legend()\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "\n",
+    "# 峰均比对比\n",
+    "plt.subplot(3, 1, 3)\n",
+    "crest_values = [original_loudness['crest_factor_db'], linear_loudness['crest_factor_db'],\n",
+    "                dbrms_loudness['crest_factor_db'], lufs_loudness['crest_factor_db']]\n",
+    "\n",
+    "plt.bar(x, crest_values, width=0.5, color='purple', alpha=0.7)\n",
+    "plt.ylabel('分贝')\n",
+    "plt.title('三种音量增强方法峰均比对比')\n",
+    "plt.xticks(x, labels)\n",
+    "plt.grid(True, alpha=0.3)\n",
+    "\n",
+    "plt.tight_layout()\n",
+    "plt.show()\n",
+    "\n",
+    "# 创建综合对比表格\n",
+    "print(\"\\n三种音量增强方法综合对比:\")\n",
+    "print(\"=\" * 80)\n",
+    "print(f\"{'方法':<12}{'峰值 (dBFS)':<20}{'RMS (dBFS)':<20}{'LUFS':<20}{'峰均比 (dB)':<15}\")\n",
+    "print(\"-\" * 80)\n",
+    "print(f\"{'原始音频':<12}{original_loudness['peak_dbfs']:<20.2f}{original_loudness['rms_dbfs']:<20.2f}{original_loudness['lufs']:<20.2f}{original_loudness['crest_factor_db']:<15.2f}\")\n",
+    "print(f\"{'Linear增强':<12}{linear_loudness['peak_dbfs']:<20.2f}{linear_loudness['rms_dbfs']:<20.2f}{linear_loudness['lufs']:<20.2f}{linear_loudness['crest_factor_db']:<15.2f}\")\n",
+    "print(f\"{'dBrms增强':<12}{dbrms_loudness['peak_dbfs']:<20.2f}{dbrms_loudness['rms_dbfs']:<20.2f}{dbrms_loudness['lufs']:<20.2f}{dbrms_loudness['crest_factor_db']:<15.2f}\")\n",
+    "print(f\"{'LUFS增强':<12}{lufs_loudness['peak_dbfs']:<20.2f}{lufs_loudness['rms_dbfs']:<20.2f}{lufs_loudness['lufs']:<20.2f}{lufs_loudness['crest_factor_db']:<15.2f}\")\n",
+    "print(\"=\" * 80)\n",
+    "\n",
+    "# 各方法响度变化量\n",
+    "print(\"\\n响度变化量 (相对于原始音频):\")\n",
+    "print(\"=\" * 80)\n",
+    "print(f\"{'方法':<12}{'峰值变化 (dB)':<20}{'RMS变化 (dB)':<20}{'LUFS变化 (dB)':<20}\")\n",
+    "print(\"-\" * 80)\n",
+    "print(f\"{'Linear增强':<12}{linear_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:<20.2f}{linear_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:<20.2f}{linear_loudness['lufs'] - original_loudness['lufs']:<20.2f}\")\n",
+    "print(f\"{'dBrms增强':<12}{dbrms_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:<20.2f}{dbrms_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:<20.2f}{dbrms_loudness['lufs'] - original_loudness['lufs']:<20.2f}\")\n",
+    "print(f\"{'LUFS增强':<12}{lufs_loudness['peak_dbfs'] - original_loudness['peak_dbfs']:<20.2f}{lufs_loudness['rms_dbfs'] - original_loudness['rms_dbfs']:<20.2f}{lufs_loudness['lufs'] - original_loudness['lufs']:<20.2f}\")\n",
+    "print(\"=\" * 80)\n",
+    "\n",
+    "# 总结分析\n",
+    "print(\"\\n音量增强方法分析总结:\")\n",
+    "print(\"=\" * 80)\n",
+    "print(\"1. Linear增强 (volume_aug_linmax):\")\n",
+    "print(\"   - 基于峰值的线性增益，目标为最大峰值为指定的线性值\")\n",
+    "print(\"   - 特点：保持动态范围不变，整体增强或减弱\")\n",
+    "print(\"   - 适用场景：需要精确控制峰值而不改变音频动态特性的场合\")\n",
+    "print(\"\\n2. dBrms增强 (volume_aug_dbrms):\")\n",
+    "print(\"   - 基于RMS电平的增益，目标为指定的dB电平\")\n",
+    "print(\"   - 特点：以能量均值为基准，更接近人耳感知\")\n",
+    "print(\"   - 适用场景：需要统一音频能量电平的场合\")\n",
+    "print(\"\\n3. LUFS增强 (volume_aug_lufs):\")\n",
+    "print(\"   - 基于国际响度标准的增益，符合广播标准\")\n",
+    "print(\"   - 特点：考虑人耳频率加权，最接近人耳响度感知\")\n",
+    "print(\"   - 适用场景：广播、流媒体、专业音频处理等需要符合响度标准的场合\")\n",
+    "print(\"=\" * 80)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "2fb931jxgtr",
+   "metadata": {},
+   "source": [
+    "# 音量增强方法综合分析\n",
+    "\n",
+    "本笔记本演示并分析了neverlib库中三种音量增强方法的特性和效果:\n",
+    "\n",
+    "1. **Linear增强 (volume_aug_linmax)**\n",
+    "   - 基于峰值的线性增益\n",
+    "   - 将音频最大峰值调整为目标线性值(0-1范围)\n",
+    "   - 保持动态范围不变\n",
+    "\n",
+    "2. **dBrms增强 (volume_aug_dbrms)**\n",
+    "   - 基于均方根(RMS)功率的增益\n",
+    "   - 将音频RMS电平调整为目标分贝值\n",
+    "   - 更接近能量感知\n",
+    "\n",
+    "3. **LUFS增强 (volume_aug_lufs)**\n",
+    "   - 基于感知响度单位(LUFS)的增益\n",
+    "   - 符合广播标准的响度归一化\n",
+    "   - 考虑人耳感知加权，最接近人耳响度感知\n",
+    "\n",
+    "各方法适用于不同场景，可根据需求选择合适的音量增强方式。"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "py311torch211",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.9"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}

neverlib 0.2.6__py3-none-any.whl → 0.2.8__py3-none-any.whl

neverlib 0.2.6py3-none-any.whl → 0.2.8py3-none-any.whl