龍天使]
說起mp3,恐怕沒人會說沒聽過。即使妳不是mp3用戶,妳也會對互聯網上無處不在的廣告、宣傳活動、朋友間的討論和豐富的資源印象深刻。對於時尚的年輕人,尤其是喜歡音樂和數碼設備的朋友來說,mp3大概是每天都要背的壹個詞。但是什麽是mp3呢?如何確定MP3的音質?如何聽高質量的MP3?我覺得下面這篇文章可以幫妳解決很多問題。
縱觀現在的mp3用戶,公認的通用制作標準是eac ripping +lame compression。我也用這個搭配。在這個制作過程中,有經驗的朋友會摸索出壹些竅門。不同的音樂使用不同的參數設置和壓縮比,範圍從標準的128kbps到最大的320kbps。但是這些比特率之間有什麽區別和不同呢?是最合適的壓縮比。cbr和vbr應該選擇哪個更好,等等。這些問題都是大家經常討論的。為了把這些細節說清楚,我特意做了壹個有針對性的實驗。我來和大家分享壹些感受。
我很喜歡聽古典音樂,所以巴赫的曲目1:慕尼黑巴赫樂團。軌跡抓取軟件eac。壓縮軟件cd`ex。玩軟件fooba2000 v0.8版本。視聽耳機是舒爾的er6和E3。由於古典音樂中細節多,樂隊大,各方面質量要求高,所以能很明顯的體現出不同處理方式之間細節上的差異。
(後面會提供頻譜對比圖)
我先用rac抓取了曲目,然後在cd`ex軟件中用lame MP3編碼器(Vision 1.92 Engine 3.92)引擎處理了wav文件。我壹個接壹個地試驗蹩腳的參數,以選擇好的結果:
第壹個參數,線程優先級,分別是最高和最低的。當其他參數相同時,比較被壓縮。發現線程優先級對聲音沒有影響。生成的文件大小是相同的。比較起來聲音壹樣,所以這個參數對音質沒有影響。
第二個參數是版本。有mpegI.mpegII和mpegII。可以選擇的v。其他參數相同。它們分別用這三個選項壓縮了三次。通過對比,雖然三種方式的文件大小相同,但mpegI的實際聽感更好。中低頻壓縮比略小,但高頻失真略多。比較適合聽人聲和流行音樂。聽著。古典的mpegI型也不錯,音底更好。但如果是小提琴等高頻率的獨奏音樂,可以推薦使用mpegII.v型,效果會更好。
第三個參數是最重要的。這是碼率。選擇它將直接影響妳的mp3文件的大小和聽感。高壓縮比會造成很大的失真,低壓縮比會造成很小的失真。但是怎樣才能找到壹個雙方都能接受的平衡點呢?這需要在實驗中仔細探索。考慮到低比特率的文件音質不適合播放音樂,最低128kbps。四個固定比特率文件(128.192.256.320 * *)用於比較和測試。
128kbps的壓縮比還是比較粗糙的。壓縮後高頻部分失真非常明顯。聽起來空洞、幹癟、刺耳。經常有閃爍的聲音。這些樂器的質地很差。有些樂器已經變了味道。妳甚至可能聽錯了。壹段音樂在3: 39的壓縮音量是3414kb。雖然音量不大,但是聲音不盡如人意。有很大的缺陷。
相比192kbps,128的壓縮效果要好很多。首先聲音是立體的,至少沒有空洞感,高頻失真小很多。聲音緊湊,噪音小而幹凈,達到了比較理想的聽音效果。只是壓縮還是比較厲害,細節表現還是不太好。樂器尤其是管樂器的質感還是很硬,不真實,缺少音樂感。5123kb。我覺得這個壓縮比對於壹個容量為128-256m的mp3播放器來說比較好。既能滿足基本的聽覺,又能大小合適。128m可以存儲95分鐘左右的音樂,256m可以翻倍到190分鐘的音樂。
相比192,256kbps的壓縮率在音質上自然更高。以曲目前10秒為例。大提琴部分的低頻顆粒感要小很多。聲音更加流暢自然。質感和質感更清晰。有很多細節。氣氛的渲染更加突出。後面幾首曲目中的聲部旋轉也表現得更加淋漓盡致。大信號和小信號的清晰度也有所提高。壹些。聲音更加細致,好聽。但與此同時,文件大小突然增加到了68,365,438+0 KB,對於壹個256m的mp3播放器來說還是可以承受的。通過計算不難知道,在碼率為256的情況下,大約可以存儲135分鐘的音樂。總的來說,足夠了。128m有點少。
320kbps是lame能提供的最大比特率。最終生成的文件為8592kb,比wav文件的37M大了8.4M左右,壓縮比基本為4.5:1。但是,生成的mp3文件聽起來非常失真。相比其他碼率,320的天然優勢顯而易見。音色,細節等等都很精致。基本上已經做到了原樣復制cd的音質。不要在帶mp3播放器的cd播放器上聽起來像。基本沒有區別。不過我用的是高分辨率的高端耳塞。再加上我在音樂和設備方面的經驗和能力,還是聽出了很多和wav文件相比的不同。首先,壓縮的mp3聽起來有點幹癟。沒有wav文件聽起來也很活潑動感。結尾細節,泛音,空間感都沒有wav文件高。不過音色上挺接近的,但是表現力差。數碼味濃。所以如果妳用的是ipod之類的微型硬盤播放器,我還是推薦妳用320kb。ps的壓縮比。這樣可以獲得最佳的聽感。當然直接聽wav最好——不壓縮。不虧。可惜沒有隨身聽支持ape無損壓縮。不然選擇多了。
我上面說的是固定比特率的壓縮比。在lame中,這被稱為CBR(即不變比特率)。其實lame最大的特點就是為用戶提供了可變比特率VBR的壓縮方式。這種方法會自動降低比特率,並在某些暫停時減小文件大小。這是壹種非常好的編碼方法。但是如何選擇VBR的最低和最高比特率範圍來獲得最合適的文件和聲音質量呢?這又是壹個需要實驗解決的問題。同樣,考慮128kbps作為基本值,我們選擇96kbps到160kbps進行壓縮。壓縮後的文件大小為3801kb,只比CBR的128kbps多了387kb。但是聲音絕對提升了壹個大的層次。至少小了壹半。雖然細節上有很多噪點,但第壹聽覺還是比128kbps強很多。壓縮後的平均碼率為147kbps,也非常節省空間。後來又從96kbps到192kbps.96kbps到224kbps.96kbps到320kbps進行了實驗。發現它們與最大cbr壓縮音質相似,即vbr從96kbps到192kbps的聲音與CBR相似,但前者為4481kb,後者為5123kb。所以vbr作為壹種追求高音質和節省空間的折中方法,確實有用。當然,另壹方面,
第四,模式參數是立體的。j立體聲。強制立體聲和單聲道。對比測試表明,標準立體聲效果最好。雖然壓縮文件大小最大,但是考慮到文件大小差異小,音質差異和聽感,立體聲還是比較理想的。
第五,壓縮法。軟件裏有vbr-old.vbr-new等兩種,但是只有前兩種好用。對比新舊vbr編碼方式,發現舊的在音質上更細膩,但是舊的壓縮速度很慢,幾乎是新的5.6倍。做壹首歌差不多要3.4分鐘,非常難用,文件大小也是6540。
Mp3吧不是憑空造出來的詞,而是壹個技術術語的縮寫,也就是MPEG-1 AudioLayer-3的縮寫拼寫。這是什麽意思?我給妳解釋壹下:MPEG-1 AudioLayer-3是MPEG-1國際標準技術協議中音頻部分的第三層協議。它描述了壹種音頻格式。看起來復雜嗎?壹點壹點的說也沒關系。首先,mpeg -這個詞是Moving Picture Exp-erts Group的縮寫,意思是運動圖像壓縮處理組。這個團體相當強大。它專門開發動態靜態視頻(包括音頻)。幾乎所有的國際技術標準。我們用他們的研究成果從電視到電影,從vcd到dvd。mp3是他們的mpeg1協議的壹部分。音頻部分在三樓,所以叫mp3。據我所知,mp3的誕生是mpeg集團的工作人員在不知不覺中發現的。它是作為壹種捕獲cd音軌的方法而產生的。頂多是當時實驗中的附屬產品。我們壹起去看看吧。
首先,大小小:根據不同的壓縮比可以得到不同大小的文件大小。不過和原來的wav格式相比,尺寸要小很多。文件大小小,存儲空間小,用於播放的硬件設備的尺寸和成本都會顯著降低,所以有很好的市場。另外,mp3文件到處下載。相對於cd機用戶要不停的買軟件,自然是壹種節約。再次:用。無論妳想要什麽。壹個小球員可以很容易地隨身攜帶。我可以隨心所欲地使用它。而且由於播放器的電路部分功耗比較低,單塊電池的工作時間也長,省去了很多更換電池的麻煩。此外,用戶可以隨意壹起聽自己喜歡的歌曲,而不必受制於音像發行商的成型軟件。自由度很大。這讓我想起了周傑倫為動感地帶[我的地盤]打廣告的壹句廣告語。我說了算!“真酷——!!
說了這麽多相關的話,肯定讓大家都等不及了。下面就深入主體,為大家透徹分析mp3的方方面面。
壹、基礎知識:
數字壓縮音頻和mp3技術;
要說mp3,我得先說數字壓縮音頻。嗯,數字壓縮音頻顧名思義就是壓縮數字音頻。但是什麽是數字音頻呢?什麽是壓縮?下面是壹些專業的解釋。感興趣的朋友要仔細看!
在計算機的數字世界裏,聲音都是以數字編碼的方式存儲的,不同於傳統生活中的模擬音頻。因為計算機只能記錄0和1的數字,所以模擬音頻必須進行定量采樣。根據奈奎斯特采樣定理。以兩倍於正弦波頻率的頻率進行采樣可以完全真實地還原波形。因此,數字記錄波的采樣頻率與其最高恢復頻率指數直接相關。比如以44.1KHZ的采樣頻率進行采樣,可以還原最高頻率22.05KHZ,略高於人耳的聽覺極限。所以a/ D轉換通常使用44.1KHZ以上的采樣頻率。但是,由於采樣頻率(通常以Hz為單位)和采樣比率(通常以比特為單位),聲學數據的文件大小是不同的。采樣頻率越高,所需的存儲空間就越大。采樣率越高,所需的存儲空間就越大。這給實際操作帶來了困難。因此,壓縮技術的出現成為必然。
數字壓縮是指“瘦身”已采樣的原始數字音頻文件。利用壹些有效的算法和方法,可以去掉文件中的冗余信息。這樣可以減小體積,方便使用。具體操作太復雜太專業了(連我這個計算數學的學生都看硬)。所以就不壹壹給妳解釋了。這裏只簡單解釋壹下壓縮中涉及的MP3壓縮編碼技術:MP3壓縮編碼使用了最小聽覺閾值、掩蔽效應和比特存儲槽五項重要技術。JointStereo和huffman編碼相結合。通過這些技術計算機的計算,我們可以大大減少數字音頻的文件大小。壓縮後產生的新音頻格式是我們熟悉的mp3。
2.壓縮原理:
無論什麽技術,都要有自己的道理。音頻技術尤其如此,因為它直接關系到我們的聽覺。為什麽壓縮後的mp3聽起來很接近cd的聲音?這和人的生理結構有很大的關系。實驗表明,人類能夠聽到的聲音的頻率範圍(音頻)。是20Hz-20kHz。但人耳對整個音頻頻段內聲音的反應並不直。2-5kHz是人耳最敏感的頻段。根據其特點,將整個音頻頻帶劃分為若幹個臨界頻帶。因為人類的聽覺系統是根據頻率來區分聲音能量的,任何頻率的小聲音都會因為掩蔽效應而被臨界頻帶內音量較大的聲音所覆蓋。MP3並沒有對其進行量化,從而去掉了人類聽覺系統所沒有的東西。可以看出,mp3是壹種有損音頻壓縮編碼。所以不管多高的碼率,MP3都是有損壓縮。音質比cd低,但多少可以接受。因人而異。
3.壓縮後的音質:
這是大家最關心的話題。壓縮後的聲音能達到什麽樣的標準?先給妳壹張圖表。讓我們看看mpeg標準中的參考值。
可以看出,由於壓縮比的不同,得到的聲音文件的質量在逐漸提高。128kbps基本達到cd音質。是這樣嗎?我的回答是:當然不是。這只是壹個官方參考數據表。在實際使用中,. 128的碼率根本無法表現壹張cd的音質。雖然mp3壓縮過程中使用的軟件算法會有所不同,但壓縮比是限制其性能的最根本因素。
Lame不是市面上唯壹的壓縮軟件,mp3也不是唯壹的音頻壓縮格式。其他公司也開發了很多有用的壓縮格式,但是由於各種原因沒有像mp3壹樣普及。但是,作為壓縮音頻家族的壹員,我想在這裏把它們介紹給妳,讓妳了解更多。
1.猿:
APE格式:猴子的音頻(
www.monkeysaudio.com
).簡單來說,ape是音頻的無損壓縮格式。它的大小只有wav文件的壹半,但音質絲毫沒有降低。可以最大程度的還原CD的音質。當然也要看抓軌質量。如果抓軌質量好,ape的音質會和CD差不多,這是mp3等有損壓縮無法做到的。當然,無損的代價是體積的增加。1CD的範圍從200mb到400mb。因此,如果有足夠的帶寬,ape為用戶交換CD帶來了更多的便利,滿足了很多古典音樂愛好者傳輸高質量CD的需求。壹張80分鐘的音樂CD大約有700米。傳輸這麽大的尺寸顯然很不方便。此時使用Monkey " " audio-可以將WAV文件壓縮成壹半大小(甚至更小)的APE文件。在理想狀態下,當妳把它。
優點:壓縮比高,音質好。加載插件後,可以直接用Winamp播放。音質比任何參數的Mp3或Mp3 Pro都要好。
缺點:壓縮解壓時間過長。
2.MP3專業版
為了降低失真度,出現了壹種新的MP3格式,MP3 Pro。它將整個音頻頻帶分成兩個通道,中低頻通道和高頻通道。傳統的MP3編碼器負責中低頻通道,另壹種采用SBR技術(頻段復制/)。解碼器負責高頻部分。最後兩者同時在MP3 Pro播放軟件中播放,使得相同碼率的MP3音質明顯優於MP3。不僅高頻細節豐富,而且顫抖現象不易察覺,非常接近原始WAV文件。
MP3 Pro采用的SBR技術並不是直接對音樂中的高頻進行分離編碼那麽簡單,而是基於對原編碼器傳輸的低頻信號進行分析,從而重構出高頻信號。
3.真實音頻
真實音頻。擴展RA:這種格式真的是網絡的靈魂。其強大的壓縮和最小的失真使它在眾多格式中脫穎而出。和MP3壹樣,也是為了解決網絡傳輸帶寬資源。所以主要目標是壓縮比和容錯,其次是音質。因此,我們通常在網上用這種格式進行新音樂試聽。
3.WMA
WMA是由Windows Media Audio編碼的文件格式。它是由微軟開發的。WMA的目標不是單機市場。是網絡!競爭對手是在線媒體市場上著名的Real Networks。微軟聲稱,WMA僅用64kbps的比特率就可以達到接近CD的音質。與以前的編碼不同,WMA支持防復制功能。她支持通過Windows Media Rights Manager進行保護,可以限制播放時間和次數,甚至是播放機器等。WM。a支持流媒體技術,即邊看邊播放,因此WMA可以輕松實現在線播放。因為它是微軟的傑作,所以微軟在Windows中增加了對WMA的支持。WMA具有優秀的技術特征。隨著微軟的大力推廣,這種格式被越來越多的人接受。相對於ra,版權大概是用戶最討厭的地方。
4.ACC:
AAC(高級音頻編碼)是杜比實驗室為音樂社區提供的壹項技術。AAC聲稱“它可以容納多達48聲道的音軌,采樣率為96 KHz,可以提供5.1聲道的音樂節目,質量相當於ITU-R廣播,數據速率為320Kbps”。相比MP3,它的音質更好,還能節省30%左右的存儲空間和帶寬。它是根據MPEG-2的規範開發的技術。松下的mp3產品都采用這種編碼方式,當然兼容mp3格式。我自己用的時候發現aac是壹種非常好用的音頻格式。128kbps的aac足以和224kbps的mp3抗衡,但空間幾乎小了壹半。但是aac和mp3編碼的風格在空間和結構上是不壹樣的。我喜不喜歡是見仁見智的問題。
5.ATRAC 3/ATRAC 3 plus:
ATRAC 3(自適應變換聲學編碼3)是由日本索尼公司開發的。它是MD采用的ATRAC的升級版,壓縮比是ATRAC的兩倍左右。而壓縮原理包括同時掩蔽、老化掩蔽和等響度曲線,類似於MP3。ATRAC3的版權保護功能是OpenMG。目前對應ATRAC3的便攜播放器主要是索尼自己的產品。然而,該公司與富士通、日立、NEC等半導體制造商簽訂了合同。羅門、三洋和TI於2000年2月制造和銷售A。TRAC3使用LSI的專利許可協議。與mp3相比,用mdlp壓縮錄制cd還是有壹定的聲音優勢的。但是版權問題,使用起來很不方便。ATRAC3 Plus由於算法先進,音質得到了進壹步的提升,但只在索尼產品中廣泛使用。這是相當令人沮喪的。
6.VQF:
所謂VQF指的是Twinvq(變換域加權間接矢量量化),也就是日本的NTT(日本電報電話公司)。由NTT人機界面實驗室開發的音頻壓縮技術。這項技術得到了著名的雅馬哈公司的支持。VQF是其檔案的延伸。在實現方法上類似於MP3。它通過使用失真算法來壓縮聲音。然而,與MP3壓縮技術相比,它有著本質的不同:VQF的目的是壓縮音樂而不。它是聲音的壓縮。所以vqf采用了壹種叫做“矢量量化”的壓縮技術。該技術首先對音頻數據進行矢量化,然後對音頻波形中相似的波形部分進行統壹平滑,對人耳敏感的部分進行加強。最後,對處理後的矢量數據進行量化,然後進行壓縮。我在自己的使用中感覺VQF比同音質的mp3要好很多。