脈衝編碼調變

脈衝編碼調變(英語:Pulse-code modulation,縮寫:PCM)是一種類比訊號的數位化方法。PCM將訊號的強度依照同樣的間距分成數段,然後用獨特的數位記號(通常是二進位)來量化。PCM常被用於數位電信系統上,也是電腦紅皮書中的標準形式。在數位視訊中它也是標準,例如使用 ITU-R BT.601。但是PCM並不流行於諸如DVDDVR的消費性商品上,因為它需要相當大的位元率(DVD格式雖然支援PCM,不過很少使用);與之相較,壓縮過的音訊較符合效率。不過,許多藍光光碟使用PCM作音訊編碼。非常頻繁地,PCM編碼以一種序列通訊的形式,使數位傳訊由一點至下一點變得更容易——不論在已給定的系統內,或物理位置。

调制编辑

 
類比訊號轉換至4-bit PCM的取樣和量化

在圖示中,一個正弦波(紅色曲線)被取樣和量化為PCM。正弦波在每段固定時間內被取一次樣,即x軸的刻度。而每一個樣本則依照某種運算法(在這個例子中是ceiling function),選定它們在y軸上的位置。這樣便產生完全離散的輸入訊號的替代物,很容易編碼成為數位資料,以作保存或操縱。以右圖為例,很清楚看出樣本為8、9、11、12、13、14、15、15、15、14…等,將它們以二進位編碼,就得到一組一組的數字:1000、1001、1011、1100、1101、1110、1111、1111、1111、1110…等,這些數位資料之後就可以被特定用途的DSP或者一般的CPU所處理。有一些PCM資料流可以和較大的聚合資料流作多工傳輸(multiplex),通常在物理層傳輸資料時都會這麼做。這個技術稱作 「時分多路復用(Time-Division Multiplexing,TDM)」 (或 「分時多工」,「時分復用」),非常廣泛地使用,例如現代的公共電話系統。

有許多方法可以內置一個處理調變的真實裝置。在真實系統中,這種裝置一般被放在單一個晶片中,並搭配一個振盪器,稱作「類比至數位轉換器(analog-to-digital converter,ADC)」。這些裝置透過振盪器觸動輸入訊號的接受,並且輸出數位化的訊號至某種處理器。 差分脉冲编码调制(DPCM) 波形编码器的一个重要分支称为差分编码器。这一类编码器包括增量调制(DM)和差分脉冲编码调制(DPCM)。差分编码器的工作原理就是消除冗余和减熵。消除冗余是对输入样本与预测值之差进行量化,达到一定的幅值水平。因此,差分编码器的两个重要组成部分就是预测器和量化器。 DPCM的工作原理以时刻k-1的输出值为基础预测时刻 k的预测值。记为 ŝ (k|k-1),从时刻k的输入信号s(k)中减去预测值,得到预测误差信号e(k),量化预测误差,然后对量化的预测误差eq(k)进行编码,传送到接收端。eq(k)加上同样编码后的ŝ(k|k-1)就得到了输入样本重构值ŝ (k)。假定不存在信道误差,接收端可准确完成重构。在发送端和接收端,均能以时间k的重构值为基础预测时刻k+1的预测值,然后重复以上的过程。 DPCM系统的主要成分是量化器、二进制编码器/解码器和预测器。 嵌入式差分脉冲编码调制 在通信和计算机网络中,不论何时出现通信繁忙的情况,都允许网络减轻负载,这有时是一个优势。如果允许在传送数据时丢掉最不重要的位,而且信源也不用重新编码,这样就可以实现前面的设想,可是,并不是所有信源的数据表示都可以这样做而不引起重构信源的较大误差,实际上,大多数压缩数据都不能这样简单地丢弃一个位,在这些情况下(Goodman1980)用嵌入编码的压缩方法来处理。 多脉冲线性预测编码(MPLPC) 多脉冲线性预测编码具有 LPC(线性预测编码)和 ADPCM(自适应差分脉冲编码调制)的预测编码结构,它与这些系统的不同之处在于它是一个分析-综合编码器,并采用感知权重设定。 MPLPC试图通过改进激励模型提高LPC的性能,但是不希望像 ADPCM和其他一些波码器那样直接量化、传送预测误差。为达到这一点,MPLPC采用几个脉冲作为一个语音帧的合成滤波器激励。脉冲数量事先选好,但需要考虑复杂性和语音品质。一般看来,MPLPC需要防止提取脉冲间隔。对于16kbit/s以下的高品质语音,其激励搜索的复杂度是可以容忍的,需要一个间隔预测循环。

码激励线性预测编码

码激励线性预测编码(CELP)是在9.6kbit/s以下速率中广泛应用的语音编码。其目的是将多脉冲 LPC中使用的分析-综合方法扩展到低比特率范围。指导思想是用有限数量的存储序列替代多脉冲激励。这个序列为码本。 CELP中的码本编码方法基于下面两个事实。

(1) 用长时或短时预测清除语音信号的冗余之后,剩余信号序列相互独立可用,具有相同概率分布的随机变序列所精确模拟,这个序列称为更新序列或激励序列。

(2)为了编码,可以找出有限数量的序列近似在语音片段中出现的重要激励序列。这个激励序列称为码本。 由于这两个因素,先要找出给定块的语音编码最好的长时和短时预测器,用各种可能的激励作用于它们,然后找出码本中的序列,生成与输入语音最相似的合成语音信号。长时和短时预测器信息和从码本中选出的激励序列的二进制数全都送入接收端进行合成。 Atal和 Schroeder(1984)首次成功地证明了码激励方法的有效性。

通常,在考虑频谱的精细结构时,语音过程可由长时预测器建模。在考虑频谱范围和共振时可由短时预测器来给出基音。 在随机编码的研究中,级联预测器的激励是一个 Gaussian分布的白噪声序列。为了用这个结构对语音编码,每5~25ms就要用 LPC中的技术对长时和短时预测器编码。随机编码或 CELP的目标是提高LPC品质,提供一种对基音提取不敏感并且不依赖于清/浊音分类的方法,这和 LPC有所不同。

在随机码本中,只需要较少码字就可以产生良好的性能,Atal和 Schroeder的研究可以使1 024个码表示40个样本,尽管1 024看起来很大,如果我们用一个独立的二进制数表示这40个语音样本中的每一个时,我们将有2=10种可能的序列。由此看来,1 024相对要小多了。甚至有些系统的码本只有256个。 除了随机码本,研究者还研究了卷积码,向量量化,置换码和经验设计码本,这些在语音编码中都可以应用,有些码本对一些说话者的语音来说比其他码本要好,当然,码本中包含较多序列可以提高性能,也使复杂度和数据速率增加。 激励码本的脱机训练可以提高合成语音的品质,这似乎是一个规律。然而,最近的研究可以使码本中所有脉冲具有同样的幅值水平,合成语音品质不受影响,如果找到一种方法能高效地搜索激励脉冲位置,那么编码综合分析搜索就可以大大简化。 标准编辑

E1是PCM其中一个标准(表现形式)。由PCM脉码调制编码中E1的时隙特征可知,E1共分32个时隙TS0-TS31。每个时隙为64K,其中TS0为被帧同步码,Si,Sa4,Sa5,Sa6,Sa7,A比特占用,若系统运用了CRC校验,则Si比特位置改传CRC校验码。TS16为信令时隙,当使用到信令(共路信令或随路信令)时,该时隙用来传输信令,用户不可用来传输数据。所以2M的PCM码型有 (1)PCM30:PCM30用户可用时隙为30个,TS1-TS15,TS17-TS31。TS16传送信令,无CRC校验。 (2)PCM31:PCM30用户可用时隙为31个,S1-TS15,TS16-TS31。TS16不传送信令,无CRC校验。 (3)PCM30C:PCM30用户可用时隙为30个,TS1-TS15,TS17-TS31。TS16传送信令,有CRC校验。 (4)PCM31C:PCM30用户可用时隙为31个,TS1-TS15,TS16-TS31。TS16不传送信令,有CRC校验。 CE1,就是把2M的传输分成了30个64K的时隙,一般写成N*64, CE1----最多可有31个信道承载数据timeslots1----31timeslots0传同步

PCME1形式结构 在PCME1形式信道中,8bit组成一个时隙(TS),由32个时隙组成了一个帧(F),16个帧组成一个复帧(MF)。在一个帧中,TS0主要用于传送帧。定位信号(FAS):CRC-4(循环冗余校验)和对端告警指示,TS16主要传送随路信令(CAS)、复帧定位信号和复帧对端告警指示,TS1至TS15和TS17至TS31共30个时隙传送话音或数据等信息。称TS1至TS15和TS17至TS31为净荷,TS0和TS16为开销。如果采用带外公共信道信令(CCS),TS16就失去了传送信令的用途,该时隙也可用来传送信息信号,这时帧结构的净荷为TS1至TS31,开销只有TS0。 PCME1形式接口 G703非平衡的75ohm,平衡的120ohm2种接口 [2] 。

PCME1的三种方法 (1)将整个2M用作一条链路,如DDN2M; (2)将2M用作若干个64k及其组合,如128K,256K等,这就是CE1; (3)在用作语音交换机的数字中继时,这也是E1最本来的用途,是把一条E1作为32个64K来用,但是时隙0和时隙15是用作signaling即信令的,所以一条E1可以传30路话音。PRI就是其中的最常用的一种接入方式,标准叫PRA信令。用2611等的广域网接口卡,经V.35-G.703转换器接E1线。这样的成本比E1卡低,DDN的2M速率线路是经HDSL线路拉至用户侧。E1可由传输设备出的光纤拉至用户侧的光端机提供E1服务。

PCME1形式使用注意事项

PCME1形式接口对接时,双方的E1不能有信号丢失/帧失步/复帧失步/滑码告警,但是双方在E1接口参数上必须完全一致,因为个别特性参数的不一致,不会在指示灯或者告警台上有任何告警,但是会造成数据通道的不通/误码/滑码/失步等情况。这些特性参数主要有;阻抗/帧结构/CRC4校验 PCME1形式阻值有75ohm和120ohm两种,PCME1形式帧结构有PCM31/PCM30/不成帧三种。

PCME1形式和PCME2形式区别 (1)PCMT1形式是高速传输的另一种标准。一条PCMT1形式可以同时有多个并发信道,每个信道都是一个独立的连接。在美国的标准PCMT1形式服务提供24个信道,每个信道的速率是56K。PCMT1形式服务与其相应的设备ISDN和普通电话相比都更加昂贵。而PCME2形式相对费却较少。 (2)PCMT1形式通常用于需要在远程站点间进高带宽高速率传输的大型组织。64K专用数据线(DDL)作为T1服务的一个变种或一个分支服务,也提供此类服务。而一条PCME1形式线,只要有ProxyServer提供的缓冲功能,在同等传输下,比PCMT1形式可以有效地节省带宽。 (3)PCMT1形式提供23个B信道和一个D信道,即23B+D.1.544Mbps;PCME1形式提供30个B信道和一个D信道,即30B+D.2.048Mbps (4)PCMT1形式表示具有高质量的通话和数据传送界面,北美使用T1标准,能够支持Max的24位用户同时拔号,而欧洲使用E1标准,可以支持30位用户,PCMT1形式仅是MAX的简单接口。

时分复用编辑 所谓时分复用,是将某一信道按时间加以分割,各路信号的抽样。值依一定的顺序占用某一时间间隔(也成时隙),即多路信号利用同一信道在不同的时间进行各自独立的传输。  

时分复用的特点:   1、复用设备内部各通路的部件基本通用   2、要求收、发两端同时工作,要求有良好的同步系统。 时分复用的目的:一个信道传输多路信号,即若干路信号可以采用时分复用方式以一定的 结构形式复接成一路高速率的复合数字信号-群路信号。  数字复接包括bit复接和码组复接。   PCM-30/32路通信设备是采用码组复接的时分复用系统。   在30/32路PCM系统中,帧结构中第一个时隙TS0用于传送帧同步信号,TS16用于传送话路信令,故只有30个时隙用于传送话音信号,所以只能提供30个话路。当采用共路信令传送方式时,必须将16帧再构成一个更大的帧,称为复帧。复帧的重复频率为500Hz,周期为2ms。   数字电话都采用PCM方式。对PCM系统,国际上采用PDH(准同步)复接技术。此技术有两种制式,一种是北美和日本采用的24路话音信号复接成一个基群的T制,速率是1554kbit/s;一种是欧洲和我国采用的30/32路话音信号复接成一个基群的E制,速率为2048kbit/s。为了进一步提高信道利用率,国际电联规定四个基群复接成一个二次群,四个二次群复接成一个三次群,四个三次群复接成一个四次群 [3]

解调编辑

從數位訊號回製成類比訊號的過程,就如同把調變的過程逆轉一樣,稱作解調變(demodulation)。在理想的系統上,每經過取樣的固定時間而讀取新的資料時,輸出會即時改變到該強度。經過這樣的即時轉換,離散的訊號本質上會有大量的高頻率能量,出現與取樣頻率的倍數相關的諧波(見方波)。要消滅這些諧波並使訊號流暢,訊號必須通過一些類比濾波器,壓制任何在預期頻域外的能量(例如大於 的頻域,這是理論上最高的解析度)。有些系統使用數位濾波器來移除最低和最高的諧波,而在有些系統中不使用任何外部的濾波器,因為不可能有系統重製出無限大的頻寬,系統本身的不足補足了訊號重製上的瑕疵,或者該系統根本就不要求準確度。取樣原理說明,任何一種PCM裝置,只要提供相對於輸入訊號足夠大的取樣頻率,在期望頻域中就不會有顯著的失真因素。

從離散的資料重製回類比訊號所使用的電子學,與從類比至數位是相似的。這些裝置被稱作「數位至模擬轉換器(digital-to-analog converters, DAC)」,與ADC的運作相似。它們依照輸入的數位訊號,輸出電壓或電流(看情況則種類不同),這個輸出然後經過濾波器和放大器,達成回放。

限制编辑

可注意的是,在任何PCM系統中,本質上有兩種損害的來源:

  • 在量化時,取樣必須迫於選擇接近哪一個整數值(即量化误差)。
  • 在樣本與樣本之間沒有任何資料,根據取樣原理,這代表任何頻率大於或等於 fs即取樣頻率)的訊號,會產生失真,或者完全消失(aliasing error)。這又稱作奈奎斯特频率(Nyquist frequency)。

由於所有樣本都依據時間取樣,重製時至關重要的便是一個準確的振盪器。如果編碼或解碼時,任何一方的振盪器不穩定,頻率漂移就會使輸出裝置的品質降低。如果兩方的頻率具有些微的差異,穩定的誤差對於品質而言並非巨大的問題。但一旦振盪器並非穩定的(即脈動的間距不相等),不論是音訊或者視訊上,都將造成巨大的失真。

数字化编辑

在一般的PCM中,類比訊號在數位化之前會經過一些處理(如振幅壓縮)。一旦經數位化,PCM訊號通常會再進一步處理(如數位資料壓縮)。

有些形式的PCM把訊號處理結合在編碼過程中。老一點的系統會把訊號的處理放在類比迴路中,當作類比至數位轉換(A/D)的一部分,新的系統則放在數位迴路中。不過由於現代基礎於轉換的音訊壓縮技術,這些簡單的技術大部分已被認為過時。

  • Differential(差異)或Delta PCM(DPCM)紀錄的是目前的值與前一個值的差異值。與相等的PCM比較,這種編碼只需要25%的位元數。
  • Adaptive DPCM(ADPCM)是DPCM的變形,給定一個噪訊比,以節省量化密度的方式,允許更大程度的節省頻寬。

在電話學中,電話的聲音訊號編碼標準是每秒8000個類比樣本,每個樣本8位元,總共每秒64 kbit的數位訊號,即DS0。DS0預設的訊號壓縮法若非μ-law (mu-law) PCM(美國和日本),就是a-law PCM(歐洲和世界剩餘地方),這些對數壓縮系統能將12或13位元的線性PCM轉換成8位元的值。這個系統被描述於國際標準G.711中。另外,曾有使用浮點數的企圖,以5位元的尾數搭配3位元的基數,不過已經放棄。

當電路的成本過高、或者音質的損失是可接受的時候,將聲音訊號更進一步壓縮將會較有效率。有一種ADPCM運算法是用來把8位元的PCM訊號轉換成4位元的ADPCM訊號,這樣電線的頻寬將能倍增。這個技術被詳細地描述於G.726標準中。

稍後又發現可能進行進一步的壓縮,並開發新一代的標準格式。在這些描述新系統或新概念的國際標準當中,有些屬於私人的專利技術,要使用它們必須付費。

有些ADPCM技術被用於Voice over IP通訊當中。

傳輸的編碼编辑

PCM的紀錄方式可以是「歸零式(return-to-zero, RZ)」的,也可以是「非歸零式(non-return-to-zero, NRZ)」的。若要使用頻寬內的資訊讓一個NRZ系統達到同步,則必定不能有長串的相同符號出現,例如連續的1或連續的0。對於二進位PCM系統來說,「1」符號的密度稱作「ones-density」。

ones-density可以透過諸如Run Length Limited的預編碼方式控制,編碼後的PCM代碼會稍微長一些,這樣可以保證在寫入音軌之前,ones-density在一定閾值以下。在另一些情況中,會寫入額外的「framing」位元,來保證在一段時間內,1或0至少會改變一次。

另外一個控制ones-density的方法是使用「scrambler」多項式,通過函式運算讓原本的資料變成看起來如偽亂數般的排列,而要回覆原本的資料只需要倒轉該多項式的效果就可以。在這種技巧中,一連串的1或0仍然可能發生在輸出中,但在一般的工程容忍度上,已經不太可能發生錯誤。

另外,訊號的直流輸出的穩定性十分重要,因為逐漸累積的直流輸出誤差(offset)會導致偵測迴路的運作超出範圍。在這種情況下,必須作特殊的測量來計算直流輸出的累積誤差,並且在必要時改變電壓大小來讓誤差永遠趨向零。

許多的這些代碼都是兩極的,脈衝要不是正就是負,或者完全沒有。在典型的alternate mark inversion代碼中,非0脈衝在正和負之間轉變。不過這些規則有可能因為必須置入「framing」或者其他特殊用途的代碼而遭到違反。

PCM的歷史编辑

評價上,PCM就像其他偉大的發明一樣簡單而明瞭。在電子通訊的歷史中,採用訊號取樣的最早理由,是為了使不同的電報系統能夠使用同一條電纜線互通有無。電報分時多工TDM(time-division multiplexing)的概念在1853年首次由美國發明家 M.B. Farmer 提出。在1903年,電技師 W.M. Miner 使用一種電力驅動的機械交換器真正達成分時多工 (TDM),讓一條線負載許多電報訊號,並將其應用於電話機上。他並使用以 3500 至 4300 赫茲頻率取樣的話機,發表一段清晰的談話:「below this was unsatisfactory.」(指取樣頻率)。但這只是TDM,使用的編碼是脈衝振幅調變(pulse-amplitude modulation, PAM)而非 PCM。

1920年Bartlane电缆图像传输系统首次利用模拟信号横跨大西洋传送了一张5级灰度图片。西方電子(Western Electric,後來成為 AT&T)的 Paul M. Rainey,在 1926 年註冊了一台傳真機的專利,它使用了光學機械ADC。但這台機器並未量產。英國工程師 Alec Reeves 並不知道這項發明,相反地,1937 年他在為法國的 ITT(International Telephone and Telegraph)工作時,發現了 PCM 在聲音傳訊上的用處。他寫出了它的理論以及優點,但並未付諸實現。在 1938 年他為此申請了專利,而美國的專利則在 1943 年批准。

第一次的數位音訊傳輸發生於二次大戰間的 1943 年,使用了 SIGSALY 聲音編碼設備。它被盟軍用來傳輸高音質的訊息。

在 1943 未過一半以前,設計 SIGSALY 系統的貝爾實驗室同樣發現了 Alec Reeves 所發現的 PCM 的那種妙用。

在 1950 年代,PCM 必須使用陰極射線管加上一個有孔的極板網柵。如同在示波器上見到的那樣,電波以取樣頻率水平地掃過,而垂直偏向則由輸入的類比訊號來控制,最終讓電波通過在極板上高低不一的孔。極板截斷了電波,產生二進位代碼形式的電流。與真正的二進位數不同,這個極板被設計成可以產生格雷碼(Gray code),避免兩極轉換時出現干擾。

PCM的命名编辑

「脈衝」一詞用在「脈衝編碼調變」中似乎顯得令人困惑,因為除了在電線中的電力以外,並沒有任何明顯可見的「脈衝」。但由於這項技術發展自另外兩個類比技術,脈衝寬度調變脈衝位置調變,這樣的結果則顯得自然。在這兩項技術中,資訊實際上就是依照離散訊號脈衝的不同寬度或位置來作編碼的。由這點來說,PCM、PWM 和 PPM 除了三者都能用於 TDM 上,以及 PCM 的確將它的代碼表回脈衝以外,PCM 和它的前輩們確實很不相像。在電話的電路中,用於編碼和解碼功能的裝置稱作codec(Coder+Decoder 的合稱)。

參考資料编辑

  • Franklin S. Cooper; Ignatius Mattingly. Computer-controlled PCM system for investigation of dichotic speech perception. Journal of the Acoustical Society of America. 1969, 46: 115. 
  • Ken C. Pohlmann. Principles of Digital Audio 2nd ed. Carmel, Indiana: Sams/Prentice-Hall Computer Publishing. 1985. ISBN 978-0-672-22634-2. 
  • D. H. Whalen, E. R. Wiley, Philip E. Rubin, and Franklin S. Cooper. The Haskins Laboratories pulse code modulation (PCM) system. Behavior Research Methods, Instruments, and Computers. 1990, 22: 550–559. 
  • Bill Waggener. Pulse Code Modulation Techniques 1st ed. New York, NY: Van Nostrand Reinhold. 1995. ISBN 978-0-442-01436-0. 
  • William N. Waggener. Pulse Code Modulation Systems Design 1st ed. Boston, MA: Artech House. 1999. ISBN 978-0-89006-776-5. 

參見编辑

外部連結编辑