售前電話
135-3656-7657
售前電話 : 135-3656-7657
釋放雙眼,帶上耳機(jī),聽聽看~!
00:00
00:00
數(shù)字化語音并沒有從根本上改變語音的實(shí)質(zhì),用0與1表示的語音最后還是為了讓人們聽到。語音是一種模擬信息,數(shù)字化的作用就是使語音傳輸系統(tǒng)中的模擬噪聲影響達(dá)到最小化。
基于以上原因,一個(gè)數(shù)字化網(wǎng)絡(luò)的性能是較容易測(cè)量的。方法是把串已知的0、1代碼輸入到網(wǎng)絡(luò)中,然后把輸出結(jié)果與輸入的代碼進(jìn)行比較。把比特串進(jìn)行匹配測(cè)試、準(zhǔn)確率達(dá)到99%的網(wǎng)絡(luò)顯然要比一個(gè)準(zhǔn)確度只有95%的網(wǎng)絡(luò)性能要好(當(dāng)然,這兩個(gè)網(wǎng)絡(luò)的性能實(shí)際上都是比較差的,但這里只是舉一個(gè)例子)。模擬信號(hào)和模擬網(wǎng)絡(luò)的質(zhì)量測(cè)量并不是這樣容易,比較速率為32kbit/s的ADPCM語音和64kbit/s的PCM語音質(zhì)量的唯一方法就是重新模擬聲音,然后讓一些人用普通的電話機(jī)來聽。
在實(shí)際的應(yīng)用中,要求評(píng)價(jià)參與者用1到5的級(jí)別來評(píng)價(jià)語音的質(zhì)量,1表示“那是什么,根本聽不清”,而5表示“和我說話的人離我好像很近,非常清楚”。在1到5之間的整數(shù)后面還可以加小數(shù)部分,直到達(dá)到評(píng)價(jià)人認(rèn)為滿意的效果,比如一個(gè)評(píng)價(jià)人可以這樣作出評(píng)價(jià):我喜歡這個(gè)語音,我認(rèn)為等級(jí)是4.1。在選擇評(píng)價(jià)用戶時(shí)必須要有明顯的差別,老年人和年輕人、男性和女性都要選一些,并且最少要有40人,而且這些人最好是對(duì)測(cè)試的方法不太了解,這樣評(píng)價(jià)結(jié)果會(huì)更準(zhǔn)確些。把得到的結(jié)果列表、算出平均水平(算術(shù)平均數(shù)),這個(gè)平均數(shù)就給出了語音質(zhì)量的平均評(píng)價(jià)得分(MOS)。
語音的MOS標(biāo)準(zhǔn)已經(jīng)應(yīng)用很長(zhǎng)時(shí)間了。MOS廣為人知,并且相對(duì)來說在測(cè)試的環(huán)境中比較容易實(shí)行。正式一點(diǎn),評(píng)價(jià)的標(biāo)準(zhǔn)是:5表示非常好、4表示較好、3表示一般、2表示較差、1表示非常差。
總之,第5等級(jí)通常被認(rèn)為是局域網(wǎng)質(zhì)量,通話的雙方由同一中心局或者由通過干線連接的兩個(gè)中心局提供服務(wù);第4等級(jí)(或者再高一點(diǎn))是長(zhǎng)途電話質(zhì)量,大多數(shù)的長(zhǎng)途通話屬于這一等級(jí);在3與4之間的等級(jí)通常被認(rèn)為是蜂窩移動(dòng)電話質(zhì)量:第2等級(jí)大多被認(rèn)為是移動(dòng)快速的對(duì)講機(jī)的語音水平(這種質(zhì)量的通話人們一般不愿意用):在第1與第2等級(jí)之間的語音質(zhì)量比較差,有時(shí)幾乎不可理解,需要不斷地重復(fù)才能聽清。通常的標(biāo)準(zhǔn)是陸線電話傳輸服務(wù)需要第4等級(jí)以上的語音質(zhì)量,而無線電話傳輸服務(wù)則需要第3等級(jí)以上的語音質(zhì)量。對(duì)于長(zhǎng)途電話而言,顯然用4.3等級(jí)提供的語音質(zhì)量與用4.0等級(jí)提供的語音質(zhì)量相比,前者的語音質(zhì)量更高。
業(yè)務(wù)供應(yīng)商們發(fā)現(xiàn)64kbit/s的PCM語音的MOS值是4.5,32kbit/s的ADPCM語音MOS值是3.0。用更先進(jìn)的ADPCM方法把PCM語音速率降低到16kbit/s將產(chǎn)生1.5的MOS值。
所有這些與當(dāng)前出現(xiàn)的速率低于64kbit/s的語音有什么關(guān)系呢?自從原先的ADPCM技術(shù)打破64kbit/s的限制,新的DSP芯片在價(jià)格上已經(jīng)大大下降,而且處理能力大大提高。更為重要的是,新的LPC機(jī)運(yùn)算法則(有時(shí)也稱為語音壓縮)已經(jīng)成熟,可以避免出于用較少比特位來表示語音而造成MOS的值下降。這樣我們就不應(yīng)該再認(rèn)為以16kbit/s的速率傳輸語音MOS值只是2或者更低。本章中提到的幾乎所有的技術(shù)都能夠使語音質(zhì)量的MOS值達(dá)到3以上,有時(shí)甚至可達(dá)到3.5或者更高。
除了用MOS值方法測(cè)量語音質(zhì)量之外,還有其他的模擬語音質(zhì)量測(cè)試方法。最為普遍應(yīng)用的是診斷程序韻律測(cè)試(DRT)和診斷程序可接受性測(cè)試(DAM)兩個(gè)系統(tǒng),這兩種方法測(cè)量語音質(zhì)量依據(jù)的標(biāo)準(zhǔn)更精細(xì)。例如,一個(gè)4.0的MOS值可以轉(zhuǎn)化為95的DRT值,或者轉(zhuǎn)化為70的DAM值。DRT法和DAM法與MOS法相比更為復(fù)雜。就DAM法來說,考慮到評(píng)價(jià)者們可能對(duì)語音的質(zhì)量評(píng)價(jià)不一致,但對(duì)背景噪聲的評(píng)價(jià)一致的情況,所以DAM法要求評(píng)價(jià)者分別評(píng)價(jià)語音質(zhì)量,背景噪聲和總體效果,一共是21分,語音質(zhì)量本身是10分,背景噪聲是8分,可理解性、舒適性和整體可接受性的總體效果是3分。近來,一些業(yè)務(wù)供應(yīng)商開始提出測(cè)試尺度從1到10的MOS法,這比尺度從1到5的MOS法更為自然,更準(zhǔn)確。在這些業(yè)務(wù)供應(yīng)商提供的產(chǎn)品使用資料中,MOS值增倍,原來為4.0的MOS值現(xiàn)在變?yōu)?.0,依此類推。