脈碼調制(原始數字音頻信號流)
類型:音頻
由ITU-T制定。
所需帶寬:1411.2kbps。
特點:音源信息完整,但冗余過大。
優點:音源信息保存完整,音質好。
缺點:信息量大,體積大,冗余過多。
應用領域:網絡電話
版稅方法:免費
備註:在計算機應用中,脈碼調制可以達到最高的保真度,廣泛用於素材保存和音樂欣賞,也用於CD、DVD和我們常見的WAV文件中。所以PCM慣例變成了無損編碼,因為PCM代表了數字音頻中最好的保真度水平,並不意味著PCM可以保證信號的絕對保真度,PCM只能最大程度的實現無限接近。計算壹個PCM音頻流的碼率非常容易,采樣率×采樣大小×通道數bps。采樣率為44.1KHz,采樣大小為16bit的脈碼調制WAV文件,數據速率為44.1k×16×2 = 141.2 kbps。我們常見的音頻CD采用脈碼調制,壹張CD的容量只能容納72分鐘的音樂信息。
WMA(Windows Media音頻)
類型:音頻
制造商:微軟公司
所需帶寬:320 ~ 112 kbps(壓縮10 ~ 12倍)
特點:在碼率小於128K的情況下,WMA在幾乎所有同級別的有損編碼格式中表現最好,但似乎128k對WMA來說是個門檻。當比特率上升時,音質不會有太大變化。
優點:碼率小於128K時,WMA效果最好,編碼的音頻文件非常小。
缺點:當比特率大於128K時,WMA失去了太多的音質。WMA標準不是開放的,它是由微軟控制的。
應用領域:網絡電話
提成方式:單獨收取。
備註:WMA,全稱Windows Media Audio,是微軟推出的壹種新的音頻格式,與MP3格式齊名。由於WMA在壓縮比和音質上超越MP3,遠優於RA(Real Audio),所以即使在低采樣頻率下也能產生更好的音質。此外,WMA擁有微軟Windows Media Player的強大後盾,因此它壹推出就贏得了掌聲。
自適應差分PCM
類型:音頻
由ITU-T制定。
所需帶寬:32Kbps
特點:ADPCM(自適應差分脈沖編碼調制)結合了APCM的自適應特性和DPCM系統的差分特性,是壹種性能良好的波形編碼。
其核心思想是:
(1)通過使用自適應思想改變量化步長的步長,即使用小的量化步長來編碼小的差異,使用大的量化步長來編碼大的差異;
②利用過去的樣本值來估計下壹個輸入樣本的預測值,使實際樣本值與預測值之差總是最小的。
優點:算法復雜度低,壓縮比低(CD音質>;400kbps),編解碼延時最短(與其他技術相比)。
缺點:音質壹般。
應用領域:網絡電話
版稅方法:免費
備註:ADPCM (ADPCM自適應差分脈碼調制)是壹種用於16bit(或更高?)壹種聲音波形數據的有損壓縮算法,將聲音流中每次采樣的164bit數據存儲為4bit,因此壓縮比為1:4,壓縮/解壓縮算法非常簡單,是壹種低空間消耗獲得高質量聲音的好方法。
線性預測編碼
類型:音頻
制造商:
所需帶寬:2Kbps-4.8Kbps
特點:壓縮比高,計算量大,音質低,價格低。
優點:壓縮比高,成本低。
缺點:計算量大,語音質量差,自然度低。
應用領域:網絡電話
版稅方法:免費
備註:參數編碼又稱聲源編碼,是在頻域或其他正交變換域從源信號中提取特征參數,轉換成數字碼進行傳輸。解碼是逆過程,對接收到的數字序列進行變換,恢復特征參數,然後根據特征參數重構語音信號。具體地,參數編碼試圖通過提取和編碼語音信號的特征參數來使重構的語音信號盡可能準確,但是重構的語音信號的波形可能與原始語音信號的波形有很大不同。例如,線性預測編碼(LPC)和各種其他改進都屬於參數編碼。編碼比特率可以壓縮到2Kbit/s-4.8Kbit/s甚至更低,但語音質量只能達到中等,特別是自然度較低。
碼激勵線性預測
類型:音頻
制造商:歐洲通信標準協會(ETSI)
所需帶寬:4 ~ 16 kbps。
特點:提高語音質量;
①利用人類聽覺的掩蔽特性,對誤差信號進行感官加權,提高語音的主觀質量;
(2)基音預測通過分數延遲進行改進,使得濁音語音更加準確,特別是提高了女聲的質量;
③采用修正的MSPE準則尋找“最佳”延遲,使得基音周期延遲的出現更加平滑;
④根據長時預測的效率,調整隨機激勵向量的大小,提高語音的主觀質量;
⑤使用基於信道誤碼率估計的自適應平滑器,可以在高信道誤碼率條件下合成高自然度的語音。
結論:
(1) CELP算法可以在低碼率編碼環境下達到滿意的壓縮效果;
②使用快速算法可以有效降低CELP算法的復雜度,使其完全實時化;
(3) ③CELP可以成功地對各種類型的語音信號進行編碼,這種適應性對於真實環境更為重要,尤其是在背景噪聲存在的情況下。
優點:它以非常低的帶寬提供清晰的語音。
缺點:-
應用領域:網絡電話
版稅方法:免費
備註:1999年,歐洲通信標準協會(ETSI)推出了基於碼激勵線性預測(CELP)的自適應多速率語音編碼器(AMR),其最低速率為4.75kb/s,達到通信質量。CELP碼激勵線性預測是碼激勵線性預測的縮寫。CELP是近10年來最成功的語音編碼算法。CELP語音編碼算法利用線性預測提取聲道參數,使用壹個包含許多典型激勵矢量的碼本作為激勵參數,每次編碼時在這個碼本中搜索壹個最優激勵矢量,這個激勵矢量的編碼值就是這個序列在碼本中的序號。
CELP被許多語音編碼標準采用,美國聯邦標準FS1016是CELP的編碼方法,主要用於高質量窄帶語音保密通信。Celp(碼激勵線性預測)這是壹種簡化的LPC算法,以低比特率(4800-9600Kbps)、清晰的語音質量和對背景噪聲的高抗擾度而聞名。CELP是中低比特率下廣泛使用的語音壓縮編碼方案。
MPEG-1音頻層1
類型:音頻
制造商:MPEG
所需帶寬:384kbps (4倍壓縮)
特點:編碼簡單。數字盒式磁帶、2聲道和VCD中使用的音頻壓縮方案是MPEG-1第壹層..
優點:與時域壓縮技術相比,壓縮方式要復雜得多,編碼效率和音質也大大提高,編碼延遲也相應增加。它可以實現“完全透明”的音質(EBU音質標準)
缺點:帶寬要求高。
應用領域:網絡電話
版稅方法:免費
備註:MPEG-1音頻壓縮編碼是第壹個高保真音頻數據壓縮的國際標準,分為三個級別:
-Layer 1(Layer 1):簡單編碼,用於數字盒式錄音磁帶。
-第2層:該算法具有中等復雜度,用於數字音頻廣播(DAB)和VCD等。
-第三層:編碼復雜,用於高質量聲音在互聯網上的傳輸,如10倍的MP3音樂壓縮。
Musicam (MPEG-1音頻層2,MP2)
類型:音頻
制造商:MPEG
所需帶寬:256 ~ 192 kbps(壓縮6 ~ 8倍)
特點:算法復雜度適中,用於數字音頻廣播(DAB)和VCD,有兩個通道。MUSICAM因其適當的復雜度和出色的音質,廣泛應用於數字演播室、DAB和DVB等數字節目的制作、交換、存儲和傳輸。
優點:與時域壓縮技術相比,壓縮方式要復雜得多,編碼效率和音質也大大提高,編碼延遲也相應增加。它可以實現“完全透明”的音質(EBU音質標準)
缺點:
應用領域:網絡電話
版稅方法:免費
備註:同MPEG-1音頻層1。
MP3(MPEG-1音頻層3)
類型:音頻
制造商:MPEG
所需帶寬:128 ~ 112kbps(壓縮10 ~ 12倍)。
特點:復雜編碼,用於互聯網上的高質量聲音傳輸,如MP3音樂壓縮10倍,2聲道。MP3是壹種基於MUSICAM和ASPEC優點的混合壓縮技術。當時MP3的復雜度比較高,不利於實時編碼。但由於其低比特率下的高水準音質,MP3成為了軟解壓和網絡播放的寵兒。
優點:壓縮比高,適合互聯網通信。
缺點:MP3在128KBitrate或以下時,會有明顯的高頻損耗。
應用領域:網絡電話
版稅方法:免費
備註:同MPEG-1音頻層1。
MPEG-2音頻層
類型:音頻
制造商:MPEG
所需帶寬:與MPEG-1層1、層2和層3相同。
特點:MPEG-2使用與MPEG-1相同的編解碼器,層1、層2、層3的結構相同,但可以支持5.1和7.1聲道的環繞聲。
優點:支持5.1聲道和7.1聲道的環繞聲。
缺點:-
應用領域:網絡電話
提成方式:單獨收取。
備註:MPEG-2使用與MPEG-1聲音相同的編解碼器,層1、層2、層3的結構相同,但可以支持5.1聲道和7.1聲道的環繞聲。
高級音頻編碼
類型:音頻
制造商:MPEG
所需帶寬:96-128 kbps。
特點:AAC可以支持1到48的任意數量的音頻通道組合,包括15低頻效果通道、配音/多聲部通道、15數據通道。可同時傳輸16個節目,每個節目的音頻和數據結構可任意指定。
AAC的主要可能應用集中在互聯網通信、數字音頻廣播,包括衛星直播和數字AM,以及數字電視和影院系統。AAC使用非常靈活的熵編碼核心來傳輸編碼頻譜數據。擁有48個主音頻通道,16個低頻增強通道,16個集成數據流,16個配音,16個編曲。
優點:支持多個音頻通道組合,提供高品質音質。
缺點:-
應用領域:網絡電話
提成方式:壹次性收取
備註:AAC於1997年形成了國際標準ISO 13818-7。高級音頻編碼——AAC已經開發成功,成為繼MPEG-2音頻標準(ISO/IEC13818-3)之後的新壹代音頻壓縮標準。
在MPEG-2的早期,最初是為了保持其音頻編碼部分兼容MPEG-1。但後來為了滿足廣播電視的要求,定義為可以獲得更高質量的多聲道音頻標準。這個標準自然和MPEG-1不兼容,所以叫MPEG-2AAC。換句話說,從表面上看,制作和播放AAC,需要使用與MP3完全不同的工具。
人力資源(部)
類型:音頻
制造商:飛利浦
所需帶寬:8Kbps
特點:目的是增加GSM網絡的容量,但會損害語音質量;由於網絡頻率不足,壹些大型運營商在大城市人口密集區開通了這種方式來增加容量。
優點:系統容量大。
缺點:音質差
應用領域:GSM
版稅方法:根據具體情況收取
備註:HR半速率是壹種GSM語音編碼方法。
神父
類型:音頻
制造商:飛利浦
所需帶寬:13Kbps
特點:是GSM手機通用的通信編碼方式,可以達到4.1左右的語音通信質量(ITU規定語音通信質量Qos滿分為5)。
優點:語音質量有所提升。
缺點:系統容量降低。
應用領域:GSM
版稅方法:根據具體情況收取
備註:FR全速率是壹種GSM語音編碼方法。
電子故障報告(electronic failure report)
類型:音頻
制造商:飛利浦
所需帶寬:13Kbps
特點:可用於基於13Kbps全速率的GSM手機語音編碼和傳輸,可獲得更好更清晰的語音質量(接近Qos4.7)。手機只能與網絡服務提供商合作來啟用此網絡功能。
優點:音質好。
缺點:網絡服務商需要開通此網絡功能,系統容量降低。
應用領域:GSM
版稅方法:根據具體情況收取
備註:EFR增強型全速率,壹種GSM網絡語音編碼方法。
自適應多速率
類型:音頻
制造商:飛利浦
所需帶寬:8Kbps(4.75 Kbps~12.2 Kbps)
特點:語音可替換靜音,平滑噪音,支持間歇傳輸,動態檢測語音。它可以在各種網絡條件下提供高質量的語音效果。
優點:音質優秀。
缺點:-
應用領域:GSM
版稅方法:根據具體情況收取
備註:GSM-ASM是壹種廣泛應用於GPRS和W-CDMA網絡的音頻標準。GSM-AMR在ETSI GSM06.90規範中定義,AMR語音編碼是GSM2+和WCDMA的默認編碼標準,是第三代無線通信系統的語音編碼標準。GSM-AMR標準基於ACELP(代數激勵線性預測)編碼。它可以在廣泛的傳輸條件下提供高質量的語音效果。
EVRC(增強型可變速率編碼器)
類型:音頻
制造商:美國高通通信公司(高通)。
所需帶寬:8Kbps或13Kbps。
特點:支持三種比特率(9.6 Kbps,4.8 Kbps和1.2 Kbps),噪音抑制和郵件過濾。它可以在各種網絡條件下提供高質量的語音效果。
優點:音質優秀。
缺點:-
應用領域:CDMA
版稅方法:根據具體情況收取
備註:EVRC編碼廣泛用於CDMA網絡。EVRC標準遵循TIA IS-127的內容。EVRC編碼基於RCELP(寬松碼激勵線性預測)標準。編碼可以以速率1(171比特/分組)、速率1/2(80比特/分組)或速率1/8(16比特/分組)的容量操作。根據要求,它還可以產生0位/包。
高通碼激勵線性預測。
類型:音頻
制造商:美國高通通信公司(高通)。
所需帶寬:8k語音編碼算法(可工作在4/4.8/8/9.6Kbps等固定速率,可工作在800Kbps~9600Kbps之間的可變速率)。
特征:使用適當的閾值來確定所需的速率。QCELP是壹種8k的語音編碼算法(在8k的速率下可以提供接近13k的語音壓縮質量)。這是壹種變速率語音編碼,是壹種基於人類語音特點的優化技術(我們應該可以理解,在日常的交流和交流中,我們並不總是以壹種恒定的方式說話,斷斷續續的、不同的音頻都是人類的自然表現)。
優點:語音清晰,背景噪音低,系統容量大。
缺點:不自由
應用領域:CDMA
特許權使用費法:為使用權支付年費。
備註:QCELP,即高通碼激勵線性預測(高通激勵線性預測編碼)。美國高通通信公司的專利語音編碼算法是北美第二代數字移動電話(CDMA)的語音編碼標準(IS95)。這種算法不僅可以工作在4/4.8/8/9.6 kbit/s的固定速率,還可以工作在800 bit/s到9600 bit/s之間的可變速率,QCELP算法被認為是迄今為止效率最高的算法,其主要特點之壹是使用合適的閾值來確定所需的速率。閾值隨著背景噪聲水平而變化,使得背景噪聲被抑制,並且即使在嘈雜的環境中也可以獲得良好的語音質量。CDMA8Kbit/s的語音類似於GSM 13mbit/s的語音..CDMA采用QCELP編碼等壹系列技術,語音清晰,背景噪聲低。其性能明顯優於其他無線移動通信系統,語音質量可與有線電話媲美。無線輻射很低。
本文來自:我愛R&D網(52RD.com)-R & D大本營
詳細來源:/blog/detail _ rd . blog _ zcy _ lhj _ 20876.html。