售前電話
135-3656-7657
售前電話 : 135-3656-7657
音視頻信號(hào)數(shù)字化后所產(chǎn)生的數(shù)據(jù)速率相當(dāng)大,例如一分鐘的雙聲道立體聲.采樣頻率為11.025kHz,8bit量化,其數(shù)據(jù)速率達(dá)176.4kbit/s,存儲(chǔ)容量需要1.323MB,而數(shù)字化激光唱盤的CD-DA紅皮書標(biāo)準(zhǔn)是采用44.1kHz采樣,16bit量化,雙聲道一分鐘其存儲(chǔ)容量達(dá)10.584MB。
視頻信息數(shù)字化后數(shù)據(jù)量更大,以分量編碼的數(shù)字視頻信號(hào)為例,其數(shù)據(jù)率高達(dá)216Mbit/s,在此情況下,1小時(shí)的電視節(jié)目需要近80GB的存儲(chǔ)容量,要遠(yuǎn)距離傳送這樣一路高速率的數(shù)字視頻信號(hào),通常要占用108~216MHz的信道帶寬,顯然這樣大的數(shù)碼率在現(xiàn)有的數(shù)字信道中傳輸或在現(xiàn)有的媒體上存儲(chǔ),其成本是十分昂貴的。因此為了提高信道利用率和在有限的信道容量下傳輸更多的信息,必須對(duì)音視頻數(shù)據(jù)進(jìn)行壓縮。
一、數(shù)據(jù)壓縮的理論依據(jù)在數(shù)據(jù)壓縮技術(shù)中Shannon所創(chuàng)立的信息論對(duì)數(shù)據(jù)壓縮有著極其重要的指導(dǎo)意義,它一方面給出了數(shù)據(jù)壓縮的理論極限,一方面指明了數(shù)據(jù)壓縮的技術(shù)途徑。
由信息論基礎(chǔ)知識(shí)可知信源概率分布越均勻其熵越大;反之其熵越小。離散無(wú)記憶信源只要其概分布不均勻就存在著信息的冗余,因而就存在著數(shù)據(jù)壓縮的可能性。而信源壓縮編碼的基本途徑之一,就是在一定信源概率分布條件下,盡可能使編碼平均碼長(zhǎng)接近于信源的熵,減少冗余信息。
信源往往并不是無(wú)記憶的,其前后出現(xiàn)的信源符號(hào)常常具有一定的相關(guān)性。兩信源符號(hào)間的相關(guān)性越大,冗余也越大,因此,數(shù)據(jù)壓縮的另一個(gè)基本途徑則是去除信源中各信源符號(hào)間的相關(guān)性。
二、限失真壓縮編碼由信息論基礎(chǔ)知識(shí)可知,信源冗余來(lái)自信源本身的相關(guān)性和信源概率分布的不均勻性。因此,通過(guò)去除信源的相關(guān)及改變信源概率分布模型,則可達(dá)到壓縮數(shù)據(jù)量的目的。限失真壓縮編碼即是在允許解碼后信號(hào)有一定失真的情況下,通過(guò)去除信源的自相關(guān)來(lái)達(dá)到壓縮數(shù)據(jù)的目的。在允許失真不超過(guò)某一限度時(shí),壓縮編碼的比特率是受限的,存在著一個(gè)下限,這個(gè)下限由率失真函數(shù)來(lái)定義。
率失真理論雖然沒(méi)有給出怎樣達(dá)到比特率下限的具體方法,但從理論上指明了方向。即在給定信號(hào)允許失真度的條件下,為了減少信號(hào)傳輸?shù)谋忍芈?,?yīng)盡量減小傳輸信號(hào)的方差。目前,在音視頻編碼中普遍采用的預(yù)測(cè)編碼和變換編碼,正是根據(jù)這一理論對(duì)原始音視頻信號(hào)進(jìn)行適當(dāng)處理,使處理后信號(hào)的方差減小,最終達(dá)到壓縮編碼的目的。
三、無(wú)失真壓縮編碼預(yù)測(cè)編碼和變換編碼都是基于去除樣值間的相關(guān)性而達(dá)到數(shù)據(jù)壓縮的目的。如果信源已經(jīng)是無(wú)記憶的,即各樣值間已沒(méi)有相關(guān)性或相關(guān)性很小。這時(shí)只要各事件出現(xiàn)的概率不相等,該信源就仍然有冗余度存在,就還有進(jìn)一步進(jìn)行數(shù)據(jù)壓縮的可能性。無(wú)失真壓縮編碼的基本原理則是去除信源的概率分布不均勻性,使編碼后的數(shù)據(jù)接近其信息熵而不產(chǎn)生失真,因此,這種編碼方法又叫熵編碼。另外,由于這種編碼完全基于信源的統(tǒng)計(jì)特性因而也可稱其為統(tǒng)計(jì)編碼。無(wú)失真壓縮編碼的方法主要有:基于信號(hào)樣值概率分布特性的Huffman編碼、算術(shù)編碼和基于信號(hào)樣值相關(guān)性的游程編碼。
1.Huffman編碼
變字長(zhǎng)編碼的最佳編碼定理:在變字長(zhǎng)編碼中,對(duì)于岀現(xiàn)概率大的信息符號(hào)編以短字長(zhǎng)的碼,對(duì)于概率小的符號(hào)編以長(zhǎng)字長(zhǎng)的碼。如果碼字長(zhǎng)度嚴(yán)格按所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆順序排列,則平均碼字長(zhǎng)度一定小于其他任何符號(hào)順序排列方式。
Huffman編碼是根據(jù)可變長(zhǎng)度最佳編碼定理,應(yīng)用Huffman算法而得到的一種編碼方法。可以證明,在給定符號(hào)集和概率模型時(shí),沒(méi)有任何其他整數(shù)碼比Huffman碼有更短的平均碼長(zhǎng),也即它是一種最優(yōu)碼。
雖然Huffman碼是變長(zhǎng)的,碼流中又沒(méi)有分隔碼字的標(biāo)識(shí)符,但由于它的無(wú)歧義性,完全能夠正確地恢復(fù)原信源所輸出的符號(hào)序列來(lái)。
需要注意的是,由于Huffman構(gòu)碼過(guò)程的最基本依據(jù)是信源的離散概率,如果信源的實(shí)際概率模型與構(gòu)碼時(shí)所假設(shè)的概率模型有差異,實(shí)際的碼長(zhǎng)將大于預(yù)期值,編碼效率將下降。
2.算術(shù)編碼
算術(shù)編碼是另一種利用信源概率分布特性、能夠趨近熵極限的編碼方法。盡管它也是對(duì)出現(xiàn)概率大的符號(hào)采用短碼,對(duì)出現(xiàn)概率小的符號(hào)采用長(zhǎng)碼,但其編碼原理與Huffman編碼卻不相同。而且在信源概率分布比較均勻的情況下其編碼效率高于Huffman編碼。它和Huffman編碼的最大區(qū)別在于它不是使用整數(shù)碼。算術(shù)編碼的特點(diǎn)在于