線譜對
線譜對(LSP)或線譜頻率(LSF)用於表示在信道上傳輸的線性預測係數(LPC)。[1]LSP具有一些特性,如對量化噪聲的敏感度較小,優於LPC的直接量化。因此,LSP在語音編碼中非常有用。
LSP表示法是日本電信電話的板倉文忠[2]於1975年發明的。[3]1975年到1981年,他研究了基於LSP的語音分析與合成問題。[4]1980年,他的團隊開發出了基於LSP的語音合成晶片。LSP是語音合成和編碼的一項重要技術,20世紀90年代的幾乎所有國際語音編碼標準都將其作為重要組成,為提高全球移動信道和互聯網上的數字語音通信水平做出了很大貢獻。[3]1985年,Bishnu S. Atal、Manfred R. Schroeder基於LSP開發了CELP算法。
數學原理
編輯線譜多項式 可寫作 ,其中:
根據構造,P是回文多項式,Q是反回文多項式;物理上,P(z)對應聲門關閉時的聲道,Q(z)則對應聲門打開時的聲道。[5]可證明:
- P、Q零點位於複平面中的單位圓。
- 繞圓運動時,P與Q的根交替出現。
- 由於P、Q係數都是實數,因此根以共軛對的形式出現。
LP多項式的線譜對表示簡單地包含了P、Q根的位置(即使 的 )。由於根成對出現,因此只需傳輸一半的根(一般 )。因此,P與Q的係數總數等於原LP係數數p(不計 )。 確定係數的常用算法[6]是在單位圓上間隔較近的點串上求多項式值,觀察結果何時變號;變號時,根必定位於測試點之間。由於P與Q的根穿插在一起,因此只要一次就能找到兩個多項式的根。
LSP分析
編輯要轉回LPC,就要計算 的根。下面只考慮線性預測多項式 階數為偶數 的情形,這時LSP多項式的 為 多項式。
LSP多項式的 可分別被 、 整除,剩餘多項式用 除,在單位圓上可表為 。即, 可進行如下因式分解:
求出該式的根,便能計算線譜對 。更具體地,如下[7]</ref> [8][9]:
(1) 由線性預測係數 計算 各係數
- 由 的定義,用下式計算。多項式係數 ,
(2) 分別除以 、
- 相當於從單位圓上的根上除去實根。
- 此多項式除法可通過係數加減來計算。將商式係數記作 ,
(3) 商式 用 置換變量
(4) 用牛頓-拉弗森法解 的兩個方程
- 在區間<math(-1,\ 1)</math>內,根 交替存在,則可交替求解兩個方程。
(5) 由求得的根計算線譜
- 由求得的N個根 求下式中的 :
將線譜對變換為線性預測係數時更簡單,與上述相反,從線譜對 求 各係數即可:
各係數為 形式的二次多項式的積,進而可作為乘以 的式子的係數,可以機械計算。
的係數有對稱性,因此能從 次係數通過以下公式變換為線性預測係數[9]:
性質
編輯線譜對有幾個有趣而有用的性質。P(z)、Q(z)的根交錯排列時,只有根單調遞減,濾波器的穩定性才有保證。另外,兩個根越近,濾波器在相應頻率上的諧振就越大。由於LSP對量化噪聲不過分敏感,因此被廣泛用於量化LPC濾波器。線譜頻率可以內插。
另見
編輯資料
編輯- Speex manual (頁面存檔備份,存於互聯網檔案館) and source code (lsp.c)
- "The Computation of Line Spectral Frequencies Using Chebyshev Polynomials" (頁面存檔備份,存於互聯網檔案館)/ P. Kabal and R. P. Ramachandran. IEEE Trans. Acoustics, Speech, Signal Processing, vol. 34, no. 6, pp. 1419–1426, Dec. 1986.
Includes an overview in relation to LPC.
- "Line Spectral Pairs" chapter (頁面存檔備份,存於互聯網檔案館) as an online excerpt (pdf) / "Digital Signal Processing - A Computer Science Perspective" (ISBN 0-471-29546-9) Jonathan Stein.
參考文獻
編輯- ^ Sahidullah, Md.; Chakroborty, Sandipan; Saha, Goutam. On the use of perceptual Line Spectral pairs Frequencies and higher-order residual moments for Speaker Identification. International Journal of Biometrics. 2010-01, 2 (4): 358–378. doi:10.1504/ijbm.2010.035450.
- ^ Zheng, F.; Song, Z.; Li, L.; Yu, W. The Distance Measure for Line Spectrum Pairs Applied to Speech Recognition (PDF). Proceedings of the 5th International Conference on Spoken Language Processing (ICSLP'98). 1998, (3): 1123–6 [2023-10-21]. (原始內容存檔 (PDF)於2022-10-09).
- ^ 3.0 3.1 List of IEEE Milestones. IEEE. [2019-07-15]. (原始內容存檔於2015-02-10).
- ^ Fumitada Itakura Oral History. IEEE Global History Network. 2009-05-20 [2009-07-21]. (原始內容存檔於2015-04-03).
- ^ http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/node51.html#SECTION000713000000000000000 (頁面存檔備份,存於互聯網檔案館) Tony Robinson: Speech Analysis
- ^ e.g. lsf.c in http://www.ietf.org/rfc/rfc3951.txt (頁面存檔備份,存於互聯網檔案館)
- ^ 嵯峨山茂樹. 応用音響學: 音聲分析(5) LSP分析.(pdf) 東京大學 応用音響學 講義資料.
- ^ 8.0 8.1 Peter Kabal, Ravi P. Ramachandran. The Computation of Line Spectral Frequencies Using Chebyshev Polynomials (頁面存檔備份,存於互聯網檔案館).(pdf) IEEE Trans. Acoustics, Speech, Signal Processing, vol.34, no. 6, pp.1419-1426, Dec. 1986.
- ^ 9.0 9.1 Wai C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. pp.239-250, 2003.