振幅包絡線,就是將不同頻率的振幅最高點連結起來形成的曲線。其 數學定義為:
其中 指代時刻t的振幅包絡, 為窗口的大小, 而 是該窗口下第k個樣本的振幅。
振幅包絡線 可以告訴我們有關響度的大體情況, 而且對於異常值比較敏感, 常用於音頻節奏檢測(Onset Detection),和音樂類型分類(music genre classification)。
接下來我們對比下古典音樂、搖滾、爵士三類音樂的振幅包絡線。
python分析語音數據有不少工具, 最為常用的應該是librosa。
首先我們先導入相關package。
import matplotlib.pyplot as plt
import numpy as np
import librosa
import librosa.</