售前電話
135-3656-7657
售前電話 : 135-3656-7657
釋放雙眼,帶上耳機,聽聽看~!
00:00
00:00
產(chǎn)生64kbit/s PCM語音要經(jīng)過三個步驟:以足夠高的頻率對輸入的模擬波形進行抽樣,以求能準確地復制出原來的信號;對樣值量化以產(chǎn)生連串的“0”“1”比特流,以此表示模擬波形:最后要對量化的比特進行編碼,以適于在長距離鏈路上傳輸。
實際上,現(xiàn)在主要有兩種方式來產(chǎn)生。第一種也是長期以來唯一讓人滿意的把語音數(shù)字化的方法,是盡可能地用一串“0”和“1”來對模擬波形進行模仿,這就是64kbit/s PCM。但這不是產(chǎn)生數(shù)字語音的唯一方法。
可以把模擬波形看作一個整體,并對那些在語音中產(chǎn)生的波形而不是對任意的波形進行編碼。模仿語音的設備被稱為語音編碼器,或簡稱為聲碼器,這一節(jié)主要與波形模仿有關,下一節(jié)將詳細說明主要運用在VoIP中的些語音編碼方法。
經(jīng)過這三個步驟在發(fā)送端由模擬語音產(chǎn)生了64kbit/s PCM語音。但是在語音數(shù)字化系統(tǒng)中模/數(shù)(A/D)轉換僅僅是完成了一半,在接收端還需有個數(shù)/模(DIA)轉換過程把到達的比特還原成聲音。可以說,數(shù)字語音的復雜性集中在發(fā)送器的A/D處。當然并不是說接收不重要,只是相對而言比較簡單而已,它只是接收比特流并按照順序恢復聲音。
這三個數(shù)字化步驟的詳細過程,數(shù)學家和電子工程師們已經(jīng)用一系列復雜的基本公式定義過了。公式是數(shù)學和工程的共同語言,為了準確的描述這三個步驟,許多電話技術文章采用了圖形、表格和公式等手段,精確地闡述了每一個步驟是如何使語音信號失真達到最小化的。不過,本書中對這些步驟的處理比較簡潔,而且在數(shù)學上也不是十分嚴格。但是,為了描述清語音數(shù)字化的過程,對每一步驟仍有許多內(nèi)容有待闡述,因為在一本工程書中,起碼的數(shù)學和工程概念是應被掌握的。
這兒更多是用類比的方法對工程概念作一般意義上的說明。考慮到這本書所針對的讀者,以易懂為目的,在嚴格性上做出一點犧牲是可以原諒的。
1、抽樣為了模擬任意的波形,要做的第一件事便是建立一套定時機制,以決定何時對輸入波形進行抽樣。典型的做法是進行等間隔抽樣,不過為何要設定相同的抽樣間隔時間卻沒有什么數(shù)學上的原因,只是這種做法更簡單罷了。從抽樣定理中我們得知,如果抽樣頻率足夠高,就能在鏈路的另端完全恢復出輸入的模擬波形。只要在接收端采用一種名為“低通濾波器”的電路來“平滑”抽樣過程中產(chǎn)生的樣值即可。
抽樣過程會產(chǎn)生脈沖振幅調(diào)制(PAM)樣值。在接收器一端只要有足夠多的PAM樣值,就可以像繪圖似的把樣值端點“連接”起來,以恢復輸入波形。不過,現(xiàn)在還不能在廣域網(wǎng)上傳送PAM樣值。這一基本思想如圖2-6所示。
圖2-6 PAM抽樣
PAM這一術語的意思是對一系列的樣值脈沖序列進行調(diào)制以模仿模擬波形。于是,它被稱為脈沖振幅調(diào)制。
在1933年,尼奎斯特給出了為再生模擬波形所需的最小抽樣頻率,也就是尼金斯特頻率,其大小是輸入的模擬波形中最高頻率成分的兩倍,有時也稱為兩倍帶寬。這里,帶寬只是衡量輸入信號頻率范圍的尺度。這樣,如果一個上限為3400Hz的模擬語音信號要以尼奎斯特速率進行抽樣,則抽樣頻率至少必須是其兩倍,即6800Hz,或說每秒抽樣6800次。
抽樣并非一定要在尼奎斯特頻率進行。尼奎斯特速率是復制出輸入波形所需的最小頻率,不過抽樣可在更高或更低的速率上進行。如果抽樣低于尼奎斯特速率,會導致波形畸變,原因是抽樣速率沒有跟上輸入信號的變化速度,所以在輸出端就不能把它準確地復制出來。若以尼奎斯特速率或更高的速率進行抽樣,則不會產(chǎn)生這種現(xiàn)象。
抽樣速率為何要大于尼奎斯特速率?因為只有這樣接收器才可獲得比必需更多的信息來重建輸出波形。這樣,如果有樣值出錯,檢測出來后就可以丟棄,毫不影響重建模擬波形。不管對語音還是音樂的模擬波形進行數(shù)字化,都是在高于尼奎斯特速率的情況下進行的,這被稱作“過量化”