售前電話
135-3656-7657
售前電話 : 135-3656-7657
IP網(wǎng)絡(luò)中的語(yǔ)音處理主要需解決兩個(gè)問(wèn)題:是在保證一定語(yǔ)音質(zhì)量的前提下盡可能降低編碼比特率;二是在IP網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量。前者主要是語(yǔ)音編碼技術(shù)和靜音檢測(cè);后者包括分組丟失補(bǔ)償、消除抖動(dòng)和回波抵消技術(shù)
1、低比特率語(yǔ)音編碼
選擇語(yǔ)音編碼算法需要考慮四個(gè)方面的問(wèn)題:編碼比特率、語(yǔ)音質(zhì)量、時(shí)延和算法復(fù)雜度。一般說(shuō)來(lái)這些指標(biāo)是有矛盾的,比特率越低,線路利用率越高,但語(yǔ)音質(zhì)量會(huì)受到影響;在同樣比特率情況下,算法設(shè)計(jì)越復(fù)雜,語(yǔ)音質(zhì)量會(huì)有所提高,但處理時(shí)延將增加。因此,采用什么類型的編碼方案和算法,要根據(jù)實(shí)際需要在上述四個(gè)指標(biāo)中取得某種折中目前在PSTN中廣泛應(yīng)用的是PCM語(yǔ)音編碼,采用的是波形編碼技術(shù),PCM語(yǔ)音編碼的比特率為64kbit/s,受波形編碼類型技術(shù)的限制,一般說(shuō)來(lái),這類編碼的最低比特率為32kbit/s,即 ADPCM。若要進(jìn)一步降低其比特率,特別是要實(shí)現(xiàn)低于16kbit/s的低比特率編碼,必須采用新的編碼技術(shù)。網(wǎng)絡(luò)電話采用參數(shù)編碼技術(shù),參數(shù)編碼通過(guò)模擬人的發(fā)聲器官,提取模型參數(shù)來(lái)降低語(yǔ)音信息編碼率。這種技術(shù)很早就提出了,過(guò)去由于算法過(guò)于復(fù)雜而無(wú)法實(shí)用,直至高性能的數(shù)字信號(hào)處理(DSP)專用芯片的研制成功才使其得到廣泛的使用。目前網(wǎng)絡(luò)電話一般使用ITUT定義的低比特率編碼標(biāo)準(zhǔn),其比特率為5.3~16kbi/s,均為中、低復(fù)雜度編碼算法,語(yǔ)音分組長(zhǎng)度在30ms以下,語(yǔ)音質(zhì)量較好。
目前,主要采用的網(wǎng)絡(luò)電話編碼技術(shù)有ITUT定義的G.729、G.723(G.723.1)等其中G.729可將經(jīng)過(guò)采樣的64kbit/s語(yǔ)音以幾乎不失真的質(zhì)量壓縮至8kbit/s,很適合在VoIP系統(tǒng)中使用。G.723.1采用5.3/6.3kbit/s雙速率語(yǔ)音編碼,其語(yǔ)音質(zhì)量好,但是處理時(shí)延較大,它是目前已標(biāo)準(zhǔn)化的最低速率的語(yǔ)音編碼算法
2、靜音檢測(cè)
用戶打電話時(shí),并不是總在占用通話信道,雙方都有講話的時(shí)間、聽對(duì)方講話的時(shí)間思考停頓的時(shí)間以及在講話過(guò)程中的停頓時(shí)間。根據(jù)傳統(tǒng)電話業(yè)務(wù)的統(tǒng)計(jì),一方用戶實(shí)際占用通話信道的時(shí)間不會(huì)超過(guò)整個(gè)通話時(shí)間的40%。在網(wǎng)絡(luò)電話業(yè)務(wù)中也存在這個(gè)問(wèn)題。由于網(wǎng)絡(luò)電話業(yè)務(wù)是將語(yǔ)音信號(hào)轉(zhuǎn)化為語(yǔ)音分組發(fā)送,在用戶沒有講話時(shí),可以不發(fā)送語(yǔ)音分組,從而進(jìn)一步降低語(yǔ)音比特率。這是通過(guò)檢測(cè)用戶是否發(fā)音來(lái)實(shí)現(xiàn)的,即當(dāng)用戶的語(yǔ)音信號(hào)能量低于一定門限值時(shí)就認(rèn)為是靜默狀態(tài),不再發(fā)送語(yǔ)音分組。在進(jìn)行靜音檢測(cè)時(shí)有兩個(gè)問(wèn)題需要注意:一是背景噪聲問(wèn)題,即如何在較大的背景噪
聲中檢測(cè)靜音;二是“前后沿剪切”( clipping)問(wèn)題。所謂前后沿剪切就是還原語(yǔ)音時(shí),由于從用戶開始講話到編碼器檢測(cè)到語(yǔ)音信號(hào)之間有一定的判斷門限和時(shí)延,有時(shí)語(yǔ)音波形的開始和結(jié)束部分會(huì)作為靜音被丟掉,因此需要在突發(fā)語(yǔ)音分組前面或后面增加一個(gè)語(yǔ)音分組進(jìn)行平滑以解決這一問(wèn)題。
在實(shí)際使用中,如果出現(xiàn)長(zhǎng)時(shí)間的靜默,會(huì)使用戶感到很不自然。因此實(shí)際上發(fā)送端常常會(huì)在靜音期間發(fā)送反映背景噪聲特點(diǎn)的分組,使接收端能生成背景噪聲,即所謂的舒適噪聲。
3、分組丟失補(bǔ)償
IP網(wǎng)絡(luò)是按照“盡力傳送”的原則傳送分組,它無(wú)法避免由于傳輸時(shí)延或網(wǎng)絡(luò)擁塞等原因造成分組被丟棄,有時(shí)線路誤碼或者網(wǎng)絡(luò)路由故障也會(huì)導(dǎo)致分組丟失。由于接收端網(wǎng)關(guān)的低比特率聲碼器采用線性預(yù)測(cè)編碼技術(shù),其當(dāng)前值是通過(guò)以前的歷史值線性組合而得,因此在丟失一個(gè)語(yǔ)音分組時(shí),可通過(guò)內(nèi)插的方法近似地恢復(fù)丟失分組。ITUT定義的標(biāo)準(zhǔn)語(yǔ)音編碼的建議中,已經(jīng)在解碼器部分中包含了分組丟失補(bǔ)償這功能。但在實(shí)際使用中,如果網(wǎng)絡(luò)電話語(yǔ)音分組連續(xù)丟失兩個(gè)以上,則表明此時(shí)網(wǎng)絡(luò)連接狀態(tài)很差,即使使用分組丟失補(bǔ)償功能,通話效果也會(huì)比較差,但由于語(yǔ)音通信對(duì)分組丟失的容忍度遠(yuǎn)比數(shù)據(jù)通信強(qiáng),所以一般情況下通話質(zhì)量仍然可以接受。
4、回波抵消
對(duì)于PC到PC的通話來(lái)說(shuō),由于語(yǔ)音信號(hào)的接收和發(fā)送經(jīng)由不同的物理線路,因此不存在回音的問(wèn)題。如果IP網(wǎng)和PSTN互連,通信雙方至少有一方是二線制電話,涉及有混合線圈的2/4線轉(zhuǎn)換電路,就會(huì)產(chǎn)生回音。其原理如圖1-2-1所示。從理論上說(shuō),當(dāng)混合線圈的阻抗完全平衡時(shí),混合線圈對(duì)端間的阻抗應(yīng)為無(wú)窮大,這樣網(wǎng)絡(luò)電話發(fā)出的語(yǔ)音信號(hào)只能送到PSTN電話,不會(huì)串到對(duì)端??墒菍?shí)際上混合線圈很難做到完全平衡,這樣一部分信號(hào)將漏到對(duì)端返回網(wǎng)絡(luò)電話,如果傳輸時(shí)延較長(zhǎng),發(fā)話者就會(huì)感到明顯的回聲,嚴(yán)重干擾通話。由于IP網(wǎng)絡(luò)時(shí)延較大,因此必須采用回波控制。
回波產(chǎn)生機(jī)理