譜建模合成(Spectral modeling synthesis,SMS)是用於語音和其他信號的一種聲學建模方法。 SMS將聲波視作諧波部分和噪聲部分的組合。諧波部分根據信號頻譜中的峰值確定,通常由短時距傅里葉變換發現。去除頻譜成分後剩下的信號(有時稱為殘餘信號,residual)可模擬為通過了時變濾波器的加性高斯白噪聲。則模型的輸出是測得諧波成分的頻率和電平,以及時變濾波器的係數

譜建模合成(基於Roads 1996, p. 153)

直觀地說,該模型可用於多種類型的音頻信號。例如,語音信號包括由聲帶振動引起的緩慢變化的諧波,以及由聲道引起的寬頻、類似噪音的聲音。樂器在敲擊或改變音高時也會產生包含諧波成分的聲音和類似噪音的打擊聲。

SMS analysis & synthesis block diagrams (based on Bonada et al. 2001, Fig.1 & Fig.2)

另見

編輯

參考文獻

編輯