當前位置:律師網大全 - 專利申請 - 美國專利mpeg

美國專利mpeg

[轉貼DVD、HDV、EVD和HVD編碼技術分析。

壹、國際音頻編碼技術的現狀和發展趨勢

目前,國際運動圖像專家組(MPEG)已經推出了幾種音頻編碼技術。其中,MPEG-1(ISO/IEC 11172-3)根據編碼復雜度分為三層,支持32、44.1、48KHz采樣率的單聲道和雙單聲道編碼。第三層(MP3),在編碼雙聲道立體聲時,以128Kbit/s編碼大部分音樂,可以達到接近CD的音質效果,成為網絡音樂和便攜式電子設備的首選標準。MPEG-2bc(ISO/IEC 13818-3)是MPEG-1的後向兼容多聲道擴展方案,增加了“低頻效果”聲道升級為5.1聲道編碼,支持16、22.5、24KHz采樣音頻。標誌著MPEG最高技術水平的MPEG-2高級音頻編碼(ISO/IEC 13818-7 AAC),以8 ~ 96 kHz的采樣率,提供1 ~ 48通道的可選範圍的高質量音頻編碼。適用於從比特率為8kbit/s的電話音質到160kbit/s的多聲道高質量音頻編碼,使用AAC對單聲道音頻進行編碼,在64Kbit/s下,大部分音樂的質量可以接近CD。因此相對於MP3的96Kbit/s,編碼效率有了很大的提高,被認為是下壹代音頻編碼標準。

在多聲道環繞聲編碼方面,美國杜比實驗室的AC-3提供了32、44.1、48KHz采樣的音頻信號的編碼,從單聲道到5.1環繞聲,支持32kbit/s到640kbit/s的多聲道高質量音頻流..目前,DolbyAC-3憑借其良好的聲場和聲像再現能力,已經廣泛應用於電影、家庭影院、DVD、數字電視音響等領域,成為事實上的國際標準。

其他優秀的音頻編碼技術,如索尼的ATARC、貝爾實驗室的PAC、微軟的WMA等都得到了廣泛的應用。

目前,從國際數字音頻應用的發展來看,數字音頻編碼技術已經廣泛應用於互聯網、廣播、個人消費電子產品、數字影視等領域。隨著3G技術的興起,它正在進入移動通信領域。因此,新壹代數字音頻編碼技術在傳輸可靠性、帶寬要求、版權安全等方面都有更高的要求。

中國在數字音頻編碼領域起步較晚。目前,開展數字音頻編碼技術研究的高校有清華大學、天津大學、西安電子科技大學、哈爾濱工業大學、華南理工大學、東南大學、北京郵電大學等。,尚未取得成熟完整的成果。

二、圖像和視頻編碼的國際標準和技術特點

在過去的10年中,圖像編碼技術得到了迅速而廣泛的發展,並日趨成熟。其標誌是關於圖像編碼的幾個國際標準的制定,即靜止圖像的國際標準化組織(ISO)和國際電工委員會(IEC)編碼標準JPEG,運動圖像的ITU-T視頻編碼標準H 261、H 263和ISO/IEC編碼。這些標準的圖像編碼算法綜合了各種優秀的圖像編碼方法,代表了目前圖像編碼的發展水平。

1、JPEG(聯合圖像專家組)

JPEG是ISO/IEC聯合圖像專家組制定的靜止圖像壓縮標準,是適用於連續色調(包括灰度和彩色)靜止圖像壓縮算法的國際標準。JPEC算法* * *有四種運行模式,其中壹種是基於空間預測的無損壓縮算法(DPCM),另外三種是基於DCT的有損壓縮算法。

1)無損壓縮算法,可以保證原圖像無失真重建。

2)基於DCT的順序模式,對圖像進行自上而下、自左而右的編碼,稱為基本系統。

3)基於DCT的漸進模式是指從粗到細對圖像進行編碼。

4)分層模式。通過對不同分辨率的圖像進行編碼,可以根據不同的要求得到不同分辨率的圖像。

JEPG對圖像壓縮有很大的伸縮性,圖像質量與比特率的關系如下:

A) 1.5 ~ 2.0 bit/pixel:與原圖基本沒有通透感。

B) 0.75 ~ 1.5 bit/pixel:質量優秀,滿足大部分應用。

C) 0.5 ~ 0.75比特/像素:良好到非常好的質量,滿足大多數應用。

D) 0.25 ~ 0.5 bit/pixel:質量中等到非常好,滿足部分應用。

2、JPEG-2000

與之前的JPEG標準相比,JPEG-2000的壓縮比比JPEG高30%左右,具有很多無法比擬的優勢。JPEG-2000與傳統JPEG最大的區別在於它摒棄了基於DCT變換的塊編碼方法,改為基於小波變換的多分辨率編碼方法。

首先,JPEG-2000可以實現無損壓縮。在實際應用中,有壹些重要的圖像,如衛星遙感圖像、醫學圖像和文物照片等,通常需要進行無損壓縮。預測方法是壹種經典的圖像無損編碼方法,已經被開發並作為標準寫入JPEG-2000。

JPEG-2000的另壹個優點是它對bi恐怖的魯棒性。因此,采用JPEG-2000的系統穩定性好,運行流暢,抗幹擾性好,操作簡單。

JPEG-2000可以實現漸進傳輸,這是JPEG-2000的壹個極其重要的特點。它可以先傳輸圖像的輪廓,再分步傳輸數據,不斷提高圖像質量以滿足用戶的需求,在網絡傳輸中具有重要意義。使用JPEG-2000下載壹張圖片,用戶可以先看到圖片的輪廓或微縮圖,再決定是否下載。而且在下載的時候,可以根據用戶的需求和帶寬來決定下載圖像的質量,從而控制數據的大小。

JPEG-2000的另壹個極其重要的優點是感興趣區域的特性。用戶可以在處理後的圖像中指定感興趣的區域,在壓縮這些區域時指定特定的壓縮質量,或者在恢復時指定特定的解壓縮要求,這給人們帶來了極大的方便。在某些情況下,圖像中只有壹小部分區域對用戶有用,對這些區域采用高壓縮比。能有效壓縮數據量而不丟失重要信息,這是感興趣區域編碼方案采用的壓縮策略。基於ROI的壓縮方法的優點是結合了接收方的主觀要求,實現了交互式壓縮。

3、MPEG-1

國際標準化組織(ISO/IEC)MPEG(運動圖像專家組)壹直致力於運動圖像及其伴音編碼的標準化,並制定了壹系列關於通用運動圖像的國際標準。MPEG-1於1993年制定,是以1.5 Mbit/s的速率對數字存儲媒體運動圖像及其音頻編碼的國際標準,該標準的制定使基於CD-ROM和MP3產品的數字視頻成為可能。MPEG-1的最大帶寬為1.5Mbit/s,其中11Mbit/s用於視頻,128Kbit/s用於音頻,其余用於MPEG系統本身。

為了追求高壓縮效率,去除圖像序列的時間冗余,滿足多媒體應用所必須的隨機存取要求,MPEG-1視頻將圖像編碼分為I幀、P幀、B幀和D幀四種類型。I幀是幀內編碼幀,采用類似JPEG的幀內DCT編碼,在幾種編碼類型中I幀的壓縮比最低。P幀是預測編碼幀,采用前向運動補償預測和誤差DCT編碼,由前壹I或P幀預測。B幀是雙向預測編碼幀,采用雙向運動補償預測和誤差的DCT編碼,前後用I或P幀預測,因此B幀的壓縮效率最高。d幀是Dc編碼幀,它只包含每個塊的DC分量。MPEG-1利用運動補償消除圖像序列時間軸上的冗余,可以使P幀和B幀的壓縮比遠高於I幀。

4、MPEG-2

MPEG組織1995推出的MPEG-2標準是在MPEG-1標準基礎上的進壹步擴展和改進,主要是針對數字視頻廣播、高清晰度電視和數字視頻光盤的4 ~ 9 MB IT/s運動圖像及其伴音的編碼標準。MPEG-2是數字電視機頂盒和DVD產品的基礎。MPEG-2系統要求向後兼容MPEG-1系統,因此其語法具有良好的兼容性和可擴展性。MPEG-2和MPEG-1的目標是壹樣的,仍然是提高壓縮比和音視頻質量。采用的核心技術是塊DCT和幀間運動補償預測技術。MPEG-2視頻允許高達100Mbit/s的數據速率,支持隔行視頻格式和許多高級性能。考慮到視頻信號隔行掃描的特點,MPEG-2專門設置了“按幀編碼”和“按場編碼”兩種模式,並相應擴展了運動補償和DCT方法,從而顯著提高了壓縮編碼的效率。考慮到標準的通用性,增加了重要的參數值,允許更大的圖像格式、比特率和運動矢量長度。此外,MPEG-2視頻壓縮編碼已擴展如下:

1)輸入/輸出圖像顏色分量的比例可以是4: 2: 0、4: 2: 2、4: 4: 4。

2)輸入/輸出圖像格式不受限制。

3)可以直接處理隔行掃描的視頻信號。

4)在空間分辨率、時間分辨率和信噪比方面的可伸縮性適合於不同目的的解碼圖像的要求,並且在傳輸中可以給予不同級別的優先級。

5)碼流結構的可伸縮性,如頭信息和運動矢量,可以給予較高的優先級,而DCT系數的高頻分量可以給予較低的優先級。

6)輸出碼率可以是恒定的,也可以是可變的,以適應同步和異步傳輸。

MPEG-2視頻是壹系列系統,每個系統都有安排好的兼容性和兼容性。它允許四種源格式或級別的編碼,從簡單的清晰度(CIF格式)到完整的高清晰度電視(HDTV)。除了這種源格式的靈活性之外,MPEG-2還提供了四個級別、五個類別和***11個從低到高分辨率的獨立技術規範。同壹類別的圖像分辨率和碼率相差甚遠。表2顯示了MPEG-2允許的級別和類別的組合。

5、MPEG-3

MPEG-3是最初由ISO/IEC為HDTV開發的編碼和壓縮標準。它要求傳輸速率在20Mbits/sev-40Mbits/sec之間,但這會使畫面略有失真。然而,由於MPEG-2的優異性能,原本為高清電視設計的MPEG-3在誕生之前就被扼殺在搖籃裏。

6、MPEG-4

1992 165438+10月,MPEG專家組決定開發壹種新的極低比特率音頻/視頻(AV)編碼國際標準,即MPEG-4。對於學術界來說,極低碼率(小於64Kbit/s)是視頻編碼標準的最後壹個碼率範圍。

MPEG-4專家組在深入分析了電視、計算機、通信及其在AV領域的交叉融合的發展趨勢後,認為MPEG-4應該提供壹種新的通信方式,其核心是基於內容的AV信息的存儲、處理和操作,支持交互性、高壓縮比和通用存儲等功能。同時,其結構應具有適應性和可擴展性,以適應硬件和軟件技術的不斷發展,並促進新技術的及時集成。

與MPEG的前兩個壓縮標準相比,MPEG-4不再是簡單的視頻和音頻編解碼標準。它以內容和交互性為核心,從而為多媒體提供了更廣闊的平臺。它定義了更多的格式和框架,而不是特定的算法,因此人們可以向系統中添加許多新的算法。除了壹些壓縮工具和算法,圖像分析與合成、計算機視覺、語音合成等各種多媒體技術也完全可以應用到編碼中。

H.261是ITU-T針對可視電話、會議電視、窄帶ISDN等要求實時編解碼、低時延的應用提出的編碼標準。標準包含的比特率為p*64Kbit/s,其中P為整數,取值範圍為1 ~ 30,對應的比特率為64 kbit/s ~ 92 mbit/s..

7、H.261

H.261標準分為幀內模式和幀間模式兩種編碼模式。對於運動適度的頭肩圖像,幀間編碼模式將占主導地位;但對於畫面切換頻繁或運動劇烈的序列圖像,幀間編碼模式要頻繁切換到幀內編碼模式。

為了減少信道誤碼,采用了壹種稱為BCH (511,493)的糾錯編碼方法。這種糾錯碼可以自動糾正493位中的2位錯誤。根據H261,信源編碼器必須具有糾錯編碼的功能,糾錯編碼是可選的。

8、H.263

1995,ITU-T總結了當時世界上視頻圖像編碼的最新發展,制定了低比特率視頻應用的H.263標準,被公認為是第壹代編碼技術基於像素的混合編碼方案所能達到的最好結果。隨後幾年,ITU-T對其進行了多次補充,以提高編碼效率,增強編碼功能。補充和修訂的版本是1998中的h . 263 ++和2000年的h263++。H.263系列標準特別適用於PSTN網絡、無線網絡和互聯網中的視頻傳輸。

H.263已被多個可視電話采用為終端標準,如支持PSTN和無線網絡的H.324、支持N-ISDN的H.320、支持B-ISDN的H.310等。H.263信源編碼算法的核心仍然是H.261標準中采用的DPCM/DCT混合編碼算法,原理框圖也與H.261非常相似。

9.MPEG-7和MPEG-21

MPEG-7是用於信息表示的“多媒體內容描述接口”,MPEG-7是“基於語義的表示”。MPEG-7定義了描述各種類型多媒體信息的描述符標準集,相應的描述方案可以用來規範多媒體描述符的生成以及不同描述符之間的有機關系。

這些描述符與指定多媒體對象的內容密切相關,提取對象特征的方法為基於內容和語義的精確檢索提供了接口。在此基礎上,MPEG-7定義了壹種描述定義語言(DDL ),用於指定和生成描述方案,即它希望提出壹種新的視頻和音頻信息的表示方法,既不同於基於波形的表示方法,也不同於基於壓縮的表示方法(如MPEG-1和MPEG-2)和基於對象的表示方法(MPEG-4)。這種表示允許對信息的含義進行壹定程度的解釋,這可以通過設備或計算機解碼器來訪問。MPEG-7的目的是提供壹種標準化的核心技術來描述多媒體環境下的視音頻內容,最終使視音頻采集像文本采集壹樣簡單方便。

MPEG-7可以描述廣泛的多媒體對象,其核心DDL語言將充分吸收現有各種媒體描述語言的特點,實現對多媒體數據的普遍適應性。MPEG-4中提出的基於對象的編碼思想將成為多媒體數據庫中處理視音頻對象的基本手段,包括特征提取、壓縮編碼等。MPEG-7的多媒體內容描述功能可以提高MPEG-1、MPEG-2和MPEG-4的性能並擴展其功能。

最後,MPEG-7將提供內容的描述,而不是內容本身。它不會取代現有的MPEG標準(MPEG-1、MPEG-2、MPEG-4),只是對現有的三個標準進行補充。

正在制定的新標準MPEG-21是支持用戶通過異構網絡和設備透明、便捷地使用多媒體資源的標準。其目的是建立壹個交互式多媒體對象,實現多種商業模式,包括版權和交易的自動管理以及對內容用戶隱私的尊重。

三、利用國內現有的磁盤驅動技術

1,DVD技術

據調查,許多DVD播放機不能實現真正的AC-3解碼功能,而是采用以下方法代替:

1),簡單兩個通道。無論光盤上的音頻數據是否根據AC-3編碼,它都作為兩個混合音頻通道輸出。由於省略了其他四個聲道的音頻輸出,硬件成本大大降低,與真正的杜比AC-3解碼相比,向Dobly公司支付專利的成本大大降低,這是壹種DVD播放器的低成本方案。這樣用戶只能聽到簡單的左右聲道效果。如果想享受真正的杜比AC-35.1聲道環繞聲效果,需要加壹個同軸或光纖輸入端子的AC-3解碼功放,其市場價在2000元左右,也就是再買壹臺DVD機的價格。

2)兩個通道,帶六個輸出端子。這種方法又稱“偽六聲道”,實際上只有三組相同的二聲道輸出,是二聲道機的簡單復制,無法實現杜比AC-35.1聲道的真機相似,往往容易成為正當利益的來源。因此,消費者在購買時應仔細甄別。

3)AC-3信道的虛擬仿真。這樣通過壹個聲場處理芯片,通過疊加、抵消等軟件算法模擬出兩個聲道的音頻,類似於AC-35+38+0聲道解碼輸出。杜比AC-35.1聲道效果,但由於其音源來自兩個主聲道,聲場的表現力和層次感比真正的AC-3解碼差很多,容易混淆觀眾,侵害消費者利益。

那麽,真正的杜比AC-35.1聲道解碼輸出是怎樣的呢?杜比AC-3是壹種專為多聲道數字音頻設計的感知編碼技術。它結合了聲學和先進的數字信號處理技術,具有前所未有的高效率、高質量和多功能性。多聲道形式上,杜比AC-3提供五個全音頻聲道,其排列方式通常被稱為3/2結構:三個前置聲道(左、中、右)加兩個環繞聲道,壹個低音頻效果聲道。壹般來說就是左前、右前、中置、環繞左、環繞右、重低音,也就是所謂的“5.1”聲道。與模擬AC-2(杜比Prologic)相比,杜比AC-3擁有兩個完全獨立的環繞聲道,每個聲道都可以提供與前排相同的三個聲道的全波段保真音頻。所以真正再現以上效果的解碼才是真正的杜比AC-35.1聲道解碼。

2.HDV技術

HD12壓縮編碼系統是北京凱程高清科技有限公司針對HDV高清數字電影格式的激光多媒體光盤開發的壓縮編碼系統。該系統采用優化的MPEG-2視頻編碼格式。它在原有MPEG-2的基礎上,采用了重新定義宏塊大小、重新設置量化長度、優化熵編碼和優化運動補償的方法。利用半導體領域的最新進展,依托半導體芯片強大的處理能力,實現了更高的壓縮比和更好的復原效果。

HD12壓縮編碼系統依托北京凱程高清科技有限公司技術人員多年的技術積累,歷時兩年多研發而成。該系統不僅具有高效的實時壓縮功能,還能完成圖像清晰度處理和修復、字幕和配音生成和疊加等多種編輯功能。

凱程高清科技有限公司研發的HD12壓縮編碼系統,可以實現高清視頻流的高效壓縮,為目前高清視頻節目的匱乏提供了良好的技術平臺,完全可以滿足目前高清視頻節目的壓縮需求,讓消費者享受到更多更好的高清視頻節目。

HDV播放器可以兼容CD、vcd、DVD,但是普通vcd、DVD上看不到HDV碟片。換句話說,HDV碟片只能搭配HDV高清數字電影播放器。如果沒有機器,買回來的碟片就只能相當於壹個報廢的碟片。

據凱程高清科技有限公司開發商介紹:“由於HDV光盤采用超壓縮技術,壹張光盤可以存儲3-5個高質量的電影節目。目前這項技術在國內只有他們廠家掌握,而且技術是加密的,外人根本偷不到。”

3.EVD科技

郭芙的音頻壓縮技術始於公司成立之初(2000年3月),被視為“新壹代高密度數字激光視盤系統EVD?”項目中的子課題經歷了起步、發展、成熟幾個階段,目前已申請了近20項核心專利技術。這些專利形成了壹套具有自主知識產權的基於多分辨率分析的高效音頻編碼技術方案EAC,在2001年7月江蘇省電子產品監督檢驗院組織的主觀音質評價實驗中,得到了與會專家的高度評價。

目前EAC編碼技術可以提供單聲道、雙聲道立體聲、5.1環繞立體聲、多采樣率、多比特率的編解碼方案,編碼效率進壹步提升,已經成為EVD?標準化音頻編碼技術標準。

為了進壹步提高編碼效率,特別是極低比特率下的音頻質量,我們在自主開發的同時,還加強了與掌握最先進音頻編碼技術的國外公司的技術合作。經過長期的技術合作,北京郭芙數字技術有限公司將與擁有世界上最先進的帶寬擴展技術的瑞典-德國編碼技術公司成立合資公司,共同開發和推廣EAC Plus技術。在EAC技術的基礎上,EAC Plus技術將進壹步提升中國音頻編碼技術水平,使中國音頻編碼技術達到國際領先水平。

我們知道,音頻編碼技術可以從很多角度進行分類:有損和無損,波形和參數,窄帶和寬帶,恒定比特率和可變速率。然而,音頻編碼處理的信號類型可以簡單地分為兩類:緩慢變化的分量和瞬時變化的分量。當然,從模型的角度來看,可以分為串分量、瞬時分量和噪聲分量。因為我們目前專註於波形編碼技術,所以不做這樣的劃分。可以說,所有的波形編碼技術都在努力尋找壹種對慢變和瞬時變都盡可能高效的編碼技術,同時保證可接受的編碼復雜度。問題的原因在於人耳對不同信號的聽覺特性。雖然從理論上講,人耳對信號的反應是壹個非常復雜的生理和心理問題,但在編碼的過程中,突出表現為兩個矛盾。對於緩變分量,人耳響應的頻率分辨率較高,但時間分辨率較低;對於瞬時變化,頻率分辨率較低,時間分辨率較高。並且該特性隨著不同的信號而變化。較高的頻率分辨率對應著較高的編碼效率,但同時前回聲抑制能力較差;時間分辨率越高,預回聲抑制能力越好,但編碼效率較低。

在設計和實現的過程中,EAC壹直在嘗試用更自然的方式對各種音頻信號進行處理/編碼,這是EAC設計的基本技術路線。具體體現在,EAC壹直遵循多分辨率分析機制,力求在統壹的濾波框架內對各類音頻信號進行更高效的編碼。

4.HVD科技

4月28日,國內首個高清影碟產業聯盟(簡稱HVD聯盟)在滬隆重成立。清華同方作為國內新壹代高清視頻播放器的重要制造商,憑借其在高清DVD領域的巨大影響力,成功成為聯盟首批成員。

HVD聯盟是由整機廠商、內容提供商、發行商、核心芯片等廠商以及相關高校、科研院所自願組成的產業聯合體,以具有自主知識產權的IC等核心關鍵元器件和自主研發的整機系統和技術為紐帶。聯盟的目標是通過產業鏈的有效整合,推動HVD技術標準、市場和產業有序、高效、持續發展,為中國DVD產業從“制造大國”向“科技強國”轉變做出貢獻。

聯盟的近期目標是發展和推動HVD具有“高清”水平的整機內容和光盤產業,使HVD成為DVD的升級產品。首批“HVD聯盟”共有18名成員,主要任務是:建立和保護“HVD”的知識產權機制;聯盟內享有知識產權;進行“HVD”標識的授權和格式驗證,確保HVD機盤統壹;做好光盤加密和防拷貝工作;組織各種技術展示、產品推介會、格式標準會議。

依托自身強大的科研實力,經過三年多的不斷探索,清華同方已經成為國內為數不多的掌握高清影碟機技術的廠商。作為清華同方影碟機產品的最新科技代表,不久前,清華同方推出了科技含量最高的DVP-i919 HD DVD,可實現480P、720P逐行掃描,1920*1080i隔行掃描。同時,作為目前DVD的替代產品,i919還支持MPEG4-4電影播放,並設置了USB1.1接口,可與眾多數碼產品直接交換和查看數據。從公司近期的銷售數據來看,清華同方高清產品在市場上獲得了不錯的反響,與市場上同期推出的EVD、HDV等替代產品並駕齊驅。

此次清華同方成功加入HVD聯盟,相信將為其贏得更多引領HD DVD時代的機會,並對HD DVD行業未來的走向產生深遠的影響。

HVD是英文高清晰度多功能光盤的縮寫。HVD集強大的功能、清晰的圖像、低廉的價格、卓越的向後兼容能力、關鍵技術和自主知識產權於壹身。HVD科技已經向國家知識產權局申請了六項發明專利。

HVD支持各種輸入格式的接口:1080 I/720 p/576 p/576 I/480 I/VGA/SVGA,符合視頻、Y/C、YPbPr高清標準。HVD,水平清晰度和垂直清晰度都達到720線。

HVD可以在壹張DVD9大小的CD上存儲150分鐘的高清電影。

5.FVD科技

當前版本的FVD規範使用650nm紅色激光;Na 0.6 ~ 0.65,其物理規格高於DVD容量;單面單層FVD磁盤容量可達5.4 GB ~ 6 GB第壹代采用8/16作為編碼方式,未來第二代將采用高效的8/15編碼方式,並提高糾錯(ECC)能力。在邏輯規範部分,微軟WindowMediaVideo-9(WMV-9 9(WMV-9)視頻壓縮技術可以容納135分鐘的1280x720p高清節目,其中新開發的高清音視頻技術如菜單動態&:動態背景、節目回放、菜單回放、子畫面回放、主從回放等。此外,為了保護知識產權,還將提供高級加密標準(AES)內容保護系統的防復制機制。

  • 上一篇:買手機要交專利費嗎?
  • 下一篇:名偵探柯南所有人物簡介(好的追加10分)
  • copyright 2024律師網大全