四虎欧美在线观看免费,国产全黄a一级毛片视频,狠狠色成人综合,福利片国产,国自产拍亚洲免费视频,浓厚な接吻と肉体の交わり,国产精品久久久久久亚洲伦理

 首頁(yè) > 新聞 > 專家觀點(diǎn) >

VoIP語(yǔ)音質(zhì)量測(cè)量新方法E-model

2004-09-14 00:00:00   作者:   來(lái)源:   評(píng)論:0  點(diǎn)擊:



  關(guān)鍵詞 語(yǔ)音質(zhì)量 IP網(wǎng)絡(luò) 測(cè)量 損傷因素
  1 引言
  近年來(lái),隨著IP網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,關(guān)于IP網(wǎng)絡(luò)所能提供的業(yè)務(wù)的服務(wù)質(zhì)量問(wèn)題受到研究者們?cè)絹?lái)越多的關(guān)注,如何來(lái)對(duì)服務(wù)質(zhì)量進(jìn)行科學(xué)可靠的測(cè)量與評(píng)價(jià)是網(wǎng)絡(luò)測(cè)量與網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)中相當(dāng)關(guān)鍵的問(wèn)題。VoIP作為下一代基于分組傳輸?shù)膮R聚業(yè)務(wù)網(wǎng)絡(luò)的先驅(qū),其語(yǔ)音質(zhì)量的測(cè)量將為未來(lái)網(wǎng)絡(luò)的服務(wù)質(zhì)量測(cè)量提供參考與經(jīng)驗(yàn)。
  2 VoIP語(yǔ)音特性對(duì)網(wǎng)絡(luò)性能的要求
  語(yǔ)音在IP網(wǎng)絡(luò)上的傳送,不同于傳統(tǒng)PSTN語(yǔ)音傳輸,它是采用語(yǔ)音編碼方式,將模擬話音數(shù)字化并打包后采用盡力投送的IP包傳送機(jī)制,通過(guò)IP網(wǎng)絡(luò)傳送到接收端,接收端收集數(shù)據(jù)包后語(yǔ)音解碼得到模擬話音。此外VoIP也與傳統(tǒng)的網(wǎng)絡(luò)應(yīng)用有許多的不同,例如,像FTP文件傳輸方式盡可能地占用網(wǎng)絡(luò)帶寬去快速地傳送文件;而ERP應(yīng)用程序則發(fā)送較少的數(shù)據(jù),但是卻在發(fā)送者和接收者之間頻繁地交互數(shù)據(jù)流。相反,VoIP只占用很少的網(wǎng)絡(luò)帶寬,但是它不能容忍網(wǎng)絡(luò)的延時(shí)和變化。即使VoIP業(yè)務(wù)和傳統(tǒng)數(shù)據(jù)業(yè)務(wù)在同一網(wǎng)絡(luò)中實(shí)現(xiàn),語(yǔ)音流和數(shù)據(jù)流也不能被同一方式處理,因?yàn)椋?
  (1)它們有不同的數(shù)據(jù)包大小
  (2)它們按照不同速率發(fā)送數(shù)據(jù)包
  (3)它們以不同的方式緩存和傳送數(shù)據(jù)包到目的地
  (4)它們必須滿足不同的用戶期望
  目前,大部分網(wǎng)絡(luò)并沒有準(zhǔn)備好為端到端的VoIP實(shí)施提供像PSTN一樣的語(yǔ)音質(zhì)量和可靠性。現(xiàn)存的VoIP網(wǎng)絡(luò)主要實(shí)現(xiàn)了IP中繼,提供兩個(gè)遠(yuǎn)距離的PSTN的廉價(jià)長(zhǎng)途連接。以下的兩個(gè)主要VoIP的語(yǔ)音特性反映對(duì)網(wǎng)絡(luò)性能的具體需求:
  第一,VoIP利用RTP實(shí)時(shí)傳輸協(xié)議傳送數(shù)據(jù)。RTP是一個(gè)基于無(wú)連接UDP的應(yīng)用協(xié)議,UDP是無(wú)連接的,它不會(huì)對(duì)數(shù)據(jù)包的傳送提供應(yīng)答和跟蹤,這樣RTP也不會(huì)重新傳送網(wǎng)絡(luò)的丟包,這就要求網(wǎng)絡(luò)傳輸中應(yīng)盡可能減少數(shù)據(jù)包的丟失;此外,按照TCP的應(yīng)用協(xié)議,RTP也沒有直接的碰撞控制,以致于因?yàn)榘l(fā)送者發(fā)送太多太快的數(shù)據(jù)包,接收者將被淹沒。為了克服這個(gè)問(wèn)題,RTP應(yīng)用程序總是以固定速率發(fā)送數(shù)據(jù)包,這就要求網(wǎng)絡(luò)能夠盡量以固定的速率傳輸數(shù)據(jù)包。
  第二,交互式會(huì)話不能容忍過(guò)大的延時(shí)。一個(gè)典型的電話會(huì)話依賴于發(fā)起者和接聽者之間的大量的交互,交互得越多,在會(huì)談中所能承受的延時(shí)則越小。這就要求數(shù)據(jù)包通過(guò)網(wǎng)絡(luò)的延時(shí)盡可能的小。
  由此可見語(yǔ)音在IP網(wǎng)絡(luò)上的傳輸需要考慮許多不同于傳統(tǒng)電話網(wǎng)絡(luò)和傳統(tǒng)數(shù)據(jù)網(wǎng)絡(luò)的因素,所有這些特性因素都將制約到VoIP的語(yǔ)音質(zhì)量。
  3 VoIP的語(yǔ)音質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)
  怎樣評(píng)判VoIP的語(yǔ)音質(zhì)量是好或是壞?當(dāng)然希望VoIP語(yǔ)音質(zhì)量與PSTN的一樣好,這也稱為Toll 級(jí)別,它是非常好的,但是事實(shí)并不一定是這樣的。在實(shí)施VoIP以前或以后,必須知道網(wǎng)絡(luò)能夠有怎樣的語(yǔ)音質(zhì)量,因此我們需要一些語(yǔ)音質(zhì)量的測(cè)量標(biāo)準(zhǔn)。從發(fā)明電話開始,語(yǔ)音質(zhì)量的測(cè)量方式是主觀的,人們摘起一個(gè)電話,然后由人耳來(lái)感知語(yǔ)音的好壞,這個(gè)方法是被廣泛認(rèn)同的。在完善之后,這個(gè)主觀的語(yǔ)音質(zhì)量測(cè)量方法就是現(xiàn)在的平均主觀值MOS方法,定義在ITU-T P.800中。基于該主觀評(píng)測(cè),人類接聽和感知語(yǔ)音質(zhì)量的行為被調(diào)研和量化,接聽何種級(jí)別質(zhì)量的語(yǔ)音,得到多少平均主觀值MOS,人類將起主要的反映作用。這個(gè)語(yǔ)音質(zhì)量和平均主觀值的對(duì)應(yīng)關(guān)系為網(wǎng)絡(luò)的配置、基準(zhǔn)和監(jiān)視提供了標(biāo)準(zhǔn)依據(jù)。
  一個(gè)平均主觀值MOS是4或更高,被認(rèn)為是比較好的語(yǔ)音質(zhì)量,而若平均主觀值MOS低于3.6,則大部分接聽者不能滿意這個(gè)語(yǔ)音質(zhì)量。雖然平均主觀測(cè)試準(zhǔn)確有效,但是,這個(gè)主觀方法存在的最大問(wèn)題就是,在現(xiàn)實(shí)中,讓一組人接聽語(yǔ)音和評(píng)價(jià)語(yǔ)音的質(zhì)量實(shí)現(xiàn)起來(lái)是非常困難和昂貴的,因此人們?cè)诓粩嗟奶剿髂苓M(jìn)行客觀測(cè)量的方法。
  現(xiàn)在許多客觀的測(cè)量方法已經(jīng)出現(xiàn)并被應(yīng)用,諸如,PSQM /PSQM+感知通話質(zhì)量測(cè)量[2],PESQ感知評(píng)估通話質(zhì)量測(cè)量[3],PAMS(英國(guó)電信)感知分析測(cè)量等。PSQM和PAMS測(cè)量方法都需要發(fā)送一個(gè)語(yǔ)音參考信號(hào)通過(guò)電話網(wǎng)絡(luò),在網(wǎng)絡(luò)的另一端采用數(shù)字信號(hào)處理的方式比較樣本信號(hào)和接收到的信號(hào),進(jìn)而估算出網(wǎng)絡(luò)的語(yǔ)音質(zhì)量。PESQ結(jié)合了PSQM和PAMS的優(yōu)勢(shì),針對(duì)VoIP和混合的端到端應(yīng)用作了改進(jìn),并針對(duì)MOS和MOS-LQ計(jì)算方法做了修改。最開始這些方法被用于測(cè)量編碼算法,后來(lái)也逐漸應(yīng)用到VoIP網(wǎng)絡(luò)系統(tǒng)的測(cè)量中,著名的測(cè)量?jī)x器生產(chǎn)廠商Agilent的語(yǔ)音質(zhì)量測(cè)量?jī)x器VQT即是代表。此外,有必要指出,平均主觀值MOS是廣泛認(rèn)同的語(yǔ)音質(zhì)量標(biāo)準(zhǔn),因此,無(wú)論采用何種方法所有測(cè)量方法都必須對(duì)應(yīng)它們的結(jié)果對(duì)應(yīng)到最終的平均主觀值MOS,以上各種方法均可以最終以MOS值表示。
  4 E-model測(cè)量方法的提出
  以上介紹的測(cè)量方法在實(shí)驗(yàn)室能夠很好地應(yīng)用于分析個(gè)別設(shè)備的問(wèn)題,例如,利用PSQM和PESQ分析話機(jī)的質(zhì)量。但是這些測(cè)量方法不適用于在數(shù)據(jù)網(wǎng)絡(luò)上分析語(yǔ)音質(zhì)量,是基于傳統(tǒng)的電話網(wǎng)絡(luò)。它們的缺點(diǎn)主要是,測(cè)量不是基于數(shù)據(jù)網(wǎng)絡(luò)的,不能反映諸如延時(shí)、抖動(dòng)和丟包等數(shù)據(jù)網(wǎng)絡(luò)特有的問(wèn)題,沒有考慮網(wǎng)絡(luò)故障對(duì)用戶感覺造成的影響,單純的從收發(fā)信號(hào)差異的角度分析網(wǎng)絡(luò)語(yǔ)音問(wèn)題。為了克服這些缺點(diǎn),國(guó)際電聯(lián)的G.107標(biāo)準(zhǔn)提出了E-model,它關(guān)注數(shù)據(jù)全面的網(wǎng)絡(luò)損傷因素,很好地適應(yīng)在數(shù)據(jù)網(wǎng)絡(luò)中語(yǔ)音質(zhì)量的評(píng)估。
  E-model的前提是假設(shè)語(yǔ)音質(zhì)量損傷因素總是物理附加的,簡(jiǎn)單說(shuō)來(lái)就是,如果諸如噪聲、回音、延時(shí)、編碼器性能、抖動(dòng)等網(wǎng)絡(luò)損傷因素能夠被靈活的加入,那么網(wǎng)絡(luò)的一個(gè)全面客觀的質(zhì)量等級(jí)或稱為“呼叫者體驗(yàn)”的因素就能夠被估計(jì)。
  4.1 E-model的基本算法公式及其與MOS值的對(duì)應(yīng)
  E-model用來(lái)作為算法最終結(jié)果的是R值,被稱為全面的網(wǎng)絡(luò)傳輸?shù)燃?jí)要素,取值范圍從0到100。R值的計(jì)算從沒有網(wǎng)絡(luò)和設(shè)備的損傷影響開始,此時(shí)語(yǔ)音質(zhì)量是最好的,R=Ro。Ro是無(wú)網(wǎng)絡(luò)延時(shí)和設(shè)備損傷因素的基本信號(hào)與收發(fā)噪聲以及電流、背景噪聲之比,即基本信噪比。但是因?yàn)榫W(wǎng)絡(luò)和設(shè)備損傷因素的存在,減少了通過(guò)網(wǎng)絡(luò)的語(yǔ)音質(zhì)量,R值的基本計(jì)算公式如下:
  R=Ro- Is-Id-Ie+A
  其中,Is:與語(yǔ)音信號(hào)傳輸同步的損傷
  Id:語(yǔ)音信號(hào)傳輸延時(shí)后的損傷
  Ie:由設(shè)備引入的損傷,例如編碼器損傷
  A:優(yōu)勢(shì)因素,致力于考慮呼叫者的期望因素,在大部分情況下,一般設(shè)置為0。
  由公式可知,全面的語(yǔ)音質(zhì)量(R值)的計(jì)算是通過(guò)首先估計(jì)一個(gè)連接的信噪比(Ro),然后從中減去網(wǎng)絡(luò)損傷(Is,Id,Ie),最后再用呼叫者對(duì)語(yǔ)音質(zhì)量的期望(A)進(jìn)行補(bǔ)償后得到。實(shí)際應(yīng)用中,基本公式中的輸入Ro、Is、Id和Ie,每一個(gè)都需要考慮各種各樣的實(shí)際網(wǎng)絡(luò)損傷因素,通過(guò)非常復(fù)雜的數(shù)學(xué)計(jì)算而得到。
  前面已經(jīng)講過(guò),任何的測(cè)量方法,最終都將對(duì)應(yīng)為MOS值標(biāo)準(zhǔn),E-model也一樣。下面的曲線圖清楚的表示出了R值和平均主觀值MOS之間的映射關(guān)系。X軸表示E模型的R值,Y軸表示平均主觀值MOS。
  加入用戶的感知特性(以用戶滿意程度表示),進(jìn)行語(yǔ)音質(zhì)量等級(jí)劃分,對(duì)應(yīng)R值和MOS值的范圍如下表所示。由于網(wǎng)絡(luò)數(shù)據(jù)與實(shí)際語(yǔ)音之間存在轉(zhuǎn)化過(guò)程,這樣固有的損耗使得R值最大只能到93.2,也就是平均主觀值MOS只有4.4。G.107的R值默認(rèn)最大為94。
  4.2 語(yǔ)音編碼方式、延時(shí)、抖動(dòng)和丟包對(duì)R值的影響
  網(wǎng)絡(luò)損傷的主要因素包括語(yǔ)音編碼、回聲、平均包延時(shí),抖動(dòng)和包丟失率;芈暜a(chǎn)生于IP網(wǎng)絡(luò)與傳統(tǒng)PSTN相連處,在單一VoIP網(wǎng)絡(luò)內(nèi)部暫不討論。在一個(gè)僅由編碼、延時(shí)、抖動(dòng)和丟包造成系統(tǒng)失真的情況下,R的計(jì)算公式可以簡(jiǎn)化如下:
  R = Ro-Icodec-Idelay-Ipdv-Ipacketloss
  下面將討論這四個(gè)主要損傷因素對(duì)R值的影響。
  在語(yǔ)音處理中,編碼是以硬件或軟件的方式去采樣語(yǔ)音和決定數(shù)據(jù)包的速率。ITU標(biāo)準(zhǔn)定義了差不多十幾種編碼方式,每一種都有不同的特點(diǎn)。低速的編碼方式占用更少的帶寬,但是因?yàn)槭褂糜袚p的壓縮算法,低速編碼更加削弱了語(yǔ)音質(zhì)量。在實(shí)際情況中,選擇低速的編碼方式能夠在相同的連接上建立更多的呼叫,但是引入了更大的延時(shí),使語(yǔ)音質(zhì)量對(duì)丟包也更加敏感。因此選擇越低速率的編碼方式,將明顯地減少E模型的R值,當(dāng)然這也不是完全絕對(duì)的。下表顯示了一些常用的編碼方式對(duì)應(yīng)的Ie值和固有R值[4]。
  延時(shí)是指話音從發(fā)起者到接收者所經(jīng)過(guò)的時(shí)間[5],一般而言,端到端的延時(shí)由以下四部分組成:
  (1)傳播延時(shí):指話音從一端到另一端通過(guò)網(wǎng)絡(luò)的時(shí)間,由信號(hào)通過(guò)傳播媒介的速度和傳播的距離決定
  (2)傳送延時(shí):指通過(guò)網(wǎng)絡(luò)路徑上的所有網(wǎng)絡(luò)設(shè)備的時(shí)間
  (3)包轉(zhuǎn)化延時(shí):指的是編碼器進(jìn)行數(shù)模轉(zhuǎn)化的時(shí)間
  (4)抖動(dòng)緩沖延時(shí):指的是在接收端用來(lái)保持一個(gè)或多個(gè)接收的數(shù)據(jù)包的時(shí)間,用來(lái)克服數(shù)據(jù)包到達(dá)時(shí)間的變化,也就是克服抖動(dòng)產(chǎn)生的延時(shí)
  延時(shí)會(huì)引起語(yǔ)音會(huì)話過(guò)程的空白,帶來(lái)語(yǔ)音的變形和會(huì)話的中斷,也就是說(shuō),延時(shí)的增大導(dǎo)致了R值的減小。延時(shí)的時(shí)長(zhǎng)在100~200ms之間開始被收聽者所察覺,使得會(huì)話不自然。建議的延時(shí)上限為150ms,若延時(shí)達(dá)到200ms則開始有嚴(yán)重的會(huì)話中斷。
  抖動(dòng),也叫做延時(shí)的變化,是指在一個(gè)VoIP呼叫過(guò)程中所有發(fā)送的數(shù)據(jù)包到達(dá)的時(shí)間差異。當(dāng)一個(gè)數(shù)據(jù)包發(fā)送時(shí),發(fā)送端在RTP報(bào)文頭上增加一個(gè)時(shí)間戳;當(dāng)在另一端被接收時(shí),接收端同樣增加另一個(gè)時(shí)間戳;計(jì)算這兩個(gè)時(shí)間戳可以得到這個(gè)數(shù)據(jù)包的通路時(shí)間。如果在一個(gè)呼叫中包含不同的通路時(shí)間,則存在抖動(dòng)。在視頻應(yīng)用程序中,抖動(dòng)表現(xiàn)為圖像閃動(dòng),而在電話呼叫中,它表現(xiàn)的效果與丟包產(chǎn)生的效果相似,某些字詞聽不清楚或錯(cuò)誤。抖動(dòng)的大小取決于數(shù)據(jù)包的通路時(shí)間的差異程度,差異程度越大,則抖動(dòng)也越大。如果抖動(dòng)值大于50ms,則平均主觀值MOS值劇烈地降低,認(rèn)為是極差的語(yǔ)音質(zhì)量。通過(guò)增加抖動(dòng)緩沖的數(shù)量,可以有效地降低抖動(dòng)的影響,但是增加了一毫秒的抖動(dòng)緩沖,則相應(yīng)增加了一毫秒的網(wǎng)絡(luò)延時(shí)。
  丟包是一個(gè)影響語(yǔ)音質(zhì)量的關(guān)鍵因素。數(shù)據(jù)包發(fā)送端和接收端之間的數(shù)據(jù)包數(shù)目的差值即為網(wǎng)絡(luò)傳輸丟失包數(shù)目。VoIP使用RTP實(shí)時(shí)傳輸協(xié)議傳輸語(yǔ)音數(shù)據(jù)包,雖然可以利用RTP報(bào)文頭的序列號(hào)檢查數(shù)據(jù)包的丟失和亂序,但是它并沒有重傳機(jī)制。任何丟包和亂序都將影響語(yǔ)音的質(zhì)量。網(wǎng)絡(luò)主要有兩種類型的丟包情況,一種是或多或少的隨機(jī)丟包,當(dāng)網(wǎng)絡(luò)保持沖突碰撞時(shí),就會(huì)偶爾有一個(gè)或兩個(gè)數(shù)據(jù)包發(fā)生丟失;另一種是爆裂丟包,是指連續(xù)一個(gè)以上的數(shù)據(jù)包丟失,會(huì)顯著地影響語(yǔ)音質(zhì)量,明顯減小R值。當(dāng)少量的丟包是隨機(jī)地分布時(shí),人耳并不容易感覺到較差的語(yǔ)音質(zhì)量。
  E-model測(cè)量方法正是將這些網(wǎng)絡(luò)的損傷因素充分予以考慮,以此作為對(duì)網(wǎng)絡(luò)語(yǔ)音質(zhì)量的全面?zhèn)鬏斣u(píng)估,真正意義上的研究了數(shù)據(jù)包化的語(yǔ)音呼叫的質(zhì)量問(wèn)題。
  5 運(yùn)用E-model對(duì)實(shí)時(shí)的VoIP網(wǎng)絡(luò)進(jìn)行語(yǔ)音質(zhì)量測(cè)量
  一種E-model在實(shí)時(shí)網(wǎng)絡(luò)測(cè)量中的應(yīng)用[6],就是測(cè)量幾個(gè)有限的E 模型參數(shù),同時(shí)估計(jì)其它非測(cè)量參數(shù),從而運(yùn)算出反映網(wǎng)絡(luò)全面?zhèn)鬏斮|(zhì)量的R值。一種客觀的語(yǔ)音質(zhì)量測(cè)量輸出了MOS值,將該MOS值轉(zhuǎn)換為Ie參數(shù),與此同時(shí)根據(jù)網(wǎng)絡(luò)信息查找E模型參數(shù)參考表得到非測(cè)量參數(shù)的值,最后將所有的參數(shù)進(jìn)行運(yùn)算,得到最終的反映全面質(zhì)量的R值。
  除此之外,有的測(cè)量?jī)x器廠商設(shè)計(jì)的基于E-model的評(píng)估工具,能夠在數(shù)據(jù)網(wǎng)絡(luò)的軟件代理之間產(chǎn)生RTP數(shù)據(jù)流去模擬VoIP語(yǔ)音呼叫,每次這個(gè)模擬VoIP語(yǔ)音呼叫運(yùn)行時(shí),網(wǎng)絡(luò)延時(shí),抖動(dòng)和丟包將作為測(cè)量結(jié)果而被記錄,這個(gè)測(cè)量通過(guò)E-model計(jì)算公式得到一維的結(jié)果R值,然后再對(duì)應(yīng)到平均主觀值MOS。此時(shí),并沒有真實(shí)的語(yǔ)音信號(hào)通過(guò)數(shù)據(jù)網(wǎng)絡(luò),與以前的諸如VQT一類的測(cè)量?jī)x器使用真實(shí)語(yǔ)音信號(hào)通過(guò)數(shù)據(jù)網(wǎng)絡(luò)的測(cè)量方法是完全不同的。
  6 結(jié)論
  評(píng)估語(yǔ)音質(zhì)量的國(guó)際電信聯(lián)盟的E-model標(biāo)準(zhǔn),可以準(zhǔn)確地建立包丟失分布和最終用戶感覺模型,將包丟失分布與編碼器和時(shí)延等建立關(guān)系,以便給出一個(gè)單一的得分。該方法被視為在數(shù)據(jù)網(wǎng)絡(luò)中進(jìn)行語(yǔ)音質(zhì)量評(píng)估具有相當(dāng)?shù)臏?zhǔn)確度。但是正如ITU-T G.107規(guī)范開頭所述“這樣的評(píng)估僅用于傳輸設(shè)計(jì)的目的,并非為了實(shí)際用戶評(píng)價(jià)預(yù)測(cè)(因?yàn)檫沒有ITU-T建議的統(tǒng)一的模型)。”E-model相當(dāng)大數(shù)量的可能輸入?yún)?shù)的組合情況還未經(jīng)過(guò)足夠的界內(nèi)驗(yàn)證和充分的實(shí)驗(yàn)室測(cè)量。許多對(duì)于傳輸設(shè)計(jì)具有高重要度的組合情況,E-model已經(jīng)可以被確信的應(yīng)用,但是對(duì)于其它的一些研究未涉及或不成熟的參數(shù)組合情況,E-model的估測(cè)仍處在置疑和研究的階段。

ChinaByte(e.chinabyte.com)

相關(guān)熱詞搜索:

上一篇:VoIP適合我嗎?

下一篇:VoIP技術(shù)之語(yǔ)音編碼器

相關(guān)閱讀:

分享到: 收藏

專題