本科畢業(yè)設(shè)計(論文) 視頻壓縮中基于快匹配算法的運動補償預(yù)測1
《本科畢業(yè)設(shè)計(論文) 視頻壓縮中基于快匹配算法的運動補償預(yù)測1》由會員分享,可在線閱讀,更多相關(guān)《本科畢業(yè)設(shè)計(論文) 視頻壓縮中基于快匹配算法的運動補償預(yù)測1(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 西 南 交 通 大 學 本科畢業(yè)設(shè)計(論文) 視頻壓縮中基于快匹配算法的 運動補償預(yù)測 BLOCK MATCHING ALGORITHM BASED ON THE FORECASTING MOTION COMPENSATION VIDEO COMPRESSION 2011年06月 承 諾 本人鄭重承諾:所呈交的設(shè)計(論文)是本人在導(dǎo)師的指導(dǎo)下獨立進行設(shè)計(研究)所取得的成果,除文中特別加以標注引用的內(nèi)容外,本文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的設(shè)計(研究)成果。對本設(shè)
2、計(研究)做出貢獻的個人和集體,均已在文中以明確方式標明。如被發(fā)現(xiàn)設(shè)計(論文)中存在抄襲、造假等學術(shù)不端行為,本人愿承擔一切后果。 學生簽名: 年 月 日 西南交通大學本科畢業(yè)設(shè)計(論文) 第I頁 院 系 計算機與通信工程系 專 業(yè) 通信工程 年 級 2007級1班
3、 姓 名 李 波 題 目 視頻壓縮中基于塊匹配算法的運動補償預(yù)測 指導(dǎo)教師 評 語
4、
5、 指導(dǎo)教師 (簽章) 評 閱 人 評 語
6、
7、 評 閱 人 (簽章) 成 績
8、 答辯委員會主任 (簽章) 年 月 日
9、 西南交通大學本科畢業(yè)設(shè)計(論文) 第IV頁 畢業(yè)設(shè)計(論文)任務(wù)書 班 級 07計通本一班 學生姓名 李波 學 號 20078191 發(fā)題日期:2011 年 2 月 28 日 完成日期:2011 年 6 月 24 日 題 目 視頻壓縮中基于塊匹配算法的運動補償預(yù)測 1、本論文的目的、意義 運動補償?shù)幕?/p>
10、思想是將圖像序列的每一幀分成許多互不重疊的宏塊,并認為宏塊內(nèi)所有象素的位移量都相同,然后對每個宏塊到參考幀某一給定特定搜索范圍內(nèi)根據(jù)一定的匹配準則找出與當前塊最相似的塊,即匹配塊,匹配塊與當前塊的相對位移即為運動矢量。視頻壓縮的時候,只需保存運動矢量和殘差數(shù)據(jù)就可以完全恢復(fù)出當前塊 。高精度的運動補償預(yù)測可以大大提高視頻編碼的效率,是視頻編碼中的重要環(huán)節(jié)。
11、
12、 2、學生應(yīng)完成的任務(wù) (1)了解運動補償?shù)哪康囊饬x和發(fā)展史; (2)掌握MATLAB仿真工具; (3)對基于塊匹配算法的運動補償預(yù)測方法進行仿真; (4)要求所編制的軟件在答辯時演示;
13、 (5)嚴格按照格式要求完成設(shè)計論文的排版打印,字數(shù)不少于1.8萬字; (6)應(yīng)完成不少于一萬英文字符的翻譯及將畢業(yè)設(shè)計(論文)的中文摘要翻譯成英文。 3、論文各部分內(nèi)容及時間分配:(共 17 周) 第一部分 熟悉設(shè)計題目功
14、能要求 ( 3周) 第二部分 掌握MATLAB仿真工具 ( 3周) 第三部分 對運動補償?shù)娜剿阉鞣椒ㄟM行仿真 ( 5周) 第四部分 完成外文摘要翻譯外文資料 ( 2周) 第五部分 畢業(yè)設(shè)計文本打印裝訂善后 ( 2周) 評閱及答辯 ( 1周) 論文整理 ( 1周) 備
15、注 答辯前應(yīng)向指導(dǎo)老師交畢業(yè)設(shè)計(論文)說明書(書面文檔應(yīng)不少于1萬8千個漢字)和電子文檔(含畢業(yè)設(shè)計(論文)說明書及應(yīng)用軟件)。
16、 指導(dǎo)教師: 年 月 日 審 批 人: 年 月 日 摘要 多媒體技術(shù)在人們的生活中應(yīng)用得越來越廣泛,隨著互聯(lián)網(wǎng)的快速發(fā)展,多媒體通信更是成為人們必不可少的需求。多媒體技術(shù)的飛速發(fā)展,使得許多應(yīng)用領(lǐng)域?qū)σ曨l圖像的實時壓縮提出了更高的要求,快速、高效的壓縮算法是解決這一問題的關(guān)鍵。 影響視頻壓縮編碼質(zhì)量和效率的因素很多,運動估計是其中最有影響力的因素之一。運動估計得越準確,視頻壓縮編碼的效率就越高,解碼出來的視頻圖像質(zhì)量越好;而且,運動估計在整個視頻壓縮編碼系統(tǒng)中的計算復(fù)雜度最大
17、。因此,快速、高效的運動估計算法是視頻壓縮編碼技術(shù)的研究重點。采用運動估計和運動補償技術(shù)可以消除視頻信號的時間冗余,從而提高編碼效率。研究設(shè)計高效、快速、魯棒的運動估計算法成為目前視頻壓縮技術(shù)中研究的重要課題。在各種運動估計方法中,塊匹配法由于其原理簡單、便于實現(xiàn)等優(yōu)點得到了普遍應(yīng)用,被許多視頻編碼標準(如MPEG以及TH.26X)所采用,在理論研究和實踐應(yīng)用中,得到了不斷的發(fā)展和完善,成為數(shù)字視頻技術(shù)的一個研究熱點。其相關(guān)快速算法也得到了廣泛的研究和發(fā)展。 本論文中,主要的任務(wù)是分析和研究幾種經(jīng)典的運動估計算法,并對它們進行相關(guān)比較。本文首先介紹了課題的研究背景與意義以及視頻壓縮技術(shù),然后
18、闡述了基于塊匹配的運動估計的基本原理,最后詳細介紹了全搜索法和幾種典型的塊匹配運動估計快速算法,分析了它們各自的技術(shù)特點,通過實驗數(shù)據(jù)定量地評價了各算法的優(yōu)缺點。 文章最后對本文工作進行了總結(jié),并對未來的研究方向進行了展望。 關(guān)鍵詞: 運動估計;塊匹配;三步搜索法 西南交通大學本科畢業(yè)設(shè)計(論文) 第40頁 Abstract With the rapid development of the Internet, multimedia technology i
19、s used more and more widely in our daily life, and multimedia communication has become a necessity. With the rapid development of multimedia technology , which puts forward higher request to real-time compression of video image in application fields, rapid and high efficient compression algorithm is
20、 the key to solve this problem. There are many factors which affect the quality and efficiency of video compression coding, and motion estimation is one of the most influential factors. The more precise of motion estimation and the higher efficiency of video compression coding, the better quality o
21、f the decoding video image; Furthermore,in the whole video compression coding system, calculative complexity of motion estimation is the largest. Therefore, rapid and high efficient motion estimation algorithm is the point of research of video compression coding technology. The motion estimation and
22、 motion compensation technology can eliminate time redundancy of the video signal, so as to improve the coding efficiency. Studying and designing the efficient, fast and robust motion estimation algorithm has been the important issue of study for the present video compression techniques. In all kind
23、s of motion estimation methods, motion estimation is used widely because of its advantages such as simple principle, easy to realize ,and is adopted by many video coding standard, such as the MPEG and TH. 26 X. And in the theoretical research and practical application, it has become a hot research t
24、opic in the field of digital video technology getting continuous development and improvement. The fast relevant algorithm also gets extensive research and development. In this paper, the main task is to analyze and study several classical motion estimation algorithms and make a comparison among th
25、em. This paper introduces the research background and significance of the topic and video compression technology at first, then expounds the principle of the motion estimation based on block matching . Finally, introduces the full search method and several typical kinds of fast algorithm of block m
26、atching motion estimation, analyses their technical characteristics, and evaluates their advantages and disadvantages of the algorithm quantitatively according to experimental data . At the end of this paper, we summarize the whole work and prospect the research direction in the future. Keywords:
27、motion estimation; Block matching; Three-step search method 目 錄 第1章 緒論 1 1.1 引言 1 1.1.1 課題的背景與意義 1 1.1.2 視頻壓縮技術(shù)介紹 3 1.2 運動估計的研究現(xiàn)狀 7 1.3 本文主要內(nèi)容和工作安排 7 第2章 運動估計概述及其技術(shù)指標 9 2.1 運動估計 10 2.2 塊匹配運動估計的基本原理 12 2.3 塊匹配的運動估計的參數(shù)和指標 14 2.3.1 分塊大小 14 2.3.2 匹配準則 14 2.3.3 搜索范圍的確定 15 2.3.4 估計精度 16
28、2.4 算法評定指標 16 第3章 典型塊匹配運動估計算法分析 18 3.1全搜索法(FS) 18 3.2 快速匹配算法 19 3.2.1 三步搜索法(FSS) 19 3.2.2 新三步搜索法(NTSS) 21 3.2.3 四步搜索法(FSS) 24 3.2.4 鉆石搜索法(DS) 25 3.2.5 六邊形搜索法(HEXBS) 27 3.3 運動估計算法仿真 30 3.3.1 實驗平臺 30 3.3.2 三步搜索法仿真示例 31 3.3.3 實驗結(jié)果 33 3.3.4 實驗結(jié)果分析 35 3.4 本章小結(jié) 35 結(jié)束語 37 4.1 本文工作總結(jié) 37 4.2
29、 研究展望 37 致謝 39 參考文獻 40 第1章 緒論 1.1 引言 1.1.1 課題的背景與意義 隨著信息技術(shù)的發(fā)展和社會的不斷進步,人類對信息的需求越來越豐富,人們希望無論何時何地都能夠方便、快捷、靈活的通過語音、數(shù)據(jù)、圖像與視頻等多種方式進行通信。視覺信息給人們直觀、生動的形象,圖像/視頻的傳輸更受到廣泛的關(guān)注。數(shù)字信號處理技術(shù)、物理媒體與網(wǎng)絡(luò)技術(shù)、超大規(guī)模集成電路技術(shù)突飛猛進的發(fā)展,使得多媒體通信成為研究和應(yīng)用的熱點。其中,最為關(guān)鍵的技術(shù)是數(shù)字視頻的處理和傳輸技術(shù),它將電視技術(shù)、計算機技術(shù)和通信技術(shù)結(jié)合在一起,在電視系統(tǒng)、計算機網(wǎng)絡(luò)和通信產(chǎn)業(yè)中得到了廣泛的應(yīng)用,
30、己經(jīng)進入千家萬戶的日常生活中。 數(shù)字視頻硬件方面的進步和有關(guān)數(shù)字視頻壓縮國際標準的推出,使得數(shù)字視頻技術(shù)領(lǐng)域趨于成熟。自20世紀90年代以來,國際電聯(lián)ITU和國際標準化組織ISO先后頒布了一系列視頻編碼和多媒體視頻通信的建議和國際標準。如ISO/IEC成立了JPEG (Joint Photographic Expert Group)和MPEG(Moving Pieture Experts Group)并先后完成了JPEG、JPEG2000、MPEG-l、MPEG-2和MPEG-4標準的制定;ITU-T也先后制定了H.261、H.262(與MPEG組織合作)、H.263/H.263+和H.26
31、4(與MPEG組織合作)等一系列國際數(shù)字視頻壓縮編碼標準。它們?yōu)橐曨l編碼技術(shù)的發(fā)展起到了巨大的推動作用。 在傳統(tǒng)的圖像通信領(lǐng)域,例如基于ISDN、PSTN以及DDN的會議電視和可視電話等視頻通信業(yè)務(wù)取得巨大成功的同時,新的多媒體通信方式也不斷出現(xiàn),尤其是Internet和數(shù)字移動通信的迅速普及,利用IP網(wǎng)絡(luò)以及寬帶無線網(wǎng)絡(luò)進行圖像和視頻信息的傳輸成為倍受人們重視的新方式。但是大量頻繁的圖像、視頻信息的交流與存貯活動也帶來了許多新要求和新問題,例如視頻圖像巨大的信息量與當前有限的信道帶寬和傳輸效率已成為制約多媒體技術(shù)發(fā)展的一個重要瓶頸,因此人們在努力增加信道帶寬和提高信道傳輸效率的同時,對視頻
32、圖像采取高效的壓縮編碼己成為目前的研究熱點。例如,1幅640x450分辨率的彩色圖像(24比特/像素),其數(shù)據(jù)量約為0.92MB,如果以每秒30幀的速度播放,則視頻信號的傳輸速率高達27.6Mbps,如果存放在容量為650MB的光盤中,在不考慮音頻信號的情況下,每張光盤也只能播放24秒。由此可見,數(shù)字視頻信息的數(shù)據(jù)量是非常巨大的,若不經(jīng)過壓縮,數(shù)字圖像傳輸所需要的高傳輸速率和數(shù)字圖像存儲所需要的巨大容量將成為推廣應(yīng)用數(shù)字視頻技術(shù)的最大障礙。要解決多媒體信息存儲容量大、數(shù)據(jù)傳輸率高的難題,就需要采用壓縮技術(shù)。 研究發(fā)現(xiàn),圖像數(shù)據(jù)表示中存在大量的冗余。通過去除那些冗余數(shù)據(jù)可以使原始圖像數(shù)據(jù)極大的
33、減少,從而解決圖像數(shù)據(jù)量巨大的問題。對于靜態(tài)圖像,最主要的數(shù)據(jù)冗余是空間冗余。圖像幀記錄了可見景物的顏色,而同一景物各采樣點的顏色之間存在著空間連貫性,但基于離散像素采樣來表示物體顏色的方法通常沒有利用景物表示顏色的這種空間連貫性,因此產(chǎn)生了空間冗余。序列圖像幀內(nèi)存在空間冗余,而幀間則存在著很大的時間冗余。這是由于序列圖像一般是位于同一時間軸區(qū)間內(nèi)的一組連續(xù)畫面,其相鄰幀間變化量一般很小,只是表現(xiàn)為移動物體所在的空間位置略微不同。運動估計和運動補償技術(shù)就是解決圖像幀間時間冗余的很好的方法。 運動估計與運動補償是現(xiàn)階段視頻壓縮編碼的關(guān)鍵技術(shù)。它是一種實現(xiàn)幀間編碼的方法,利用前后兩幀或若干幀之間
34、的時間相關(guān)性,去除時間冗余度。幀間編碼之所以能減少冗余度,是因為在一般視頻序列的兩幀之間有很大的空間結(jié)構(gòu)相似性,前后兩幀的差幀可以用比幀內(nèi)編碼所需少很多的比特數(shù)來進行編碼。而幀間預(yù)測的方法基本上是以基于塊匹配的運動估計(補償)算法為主。 運動估計目前面臨的主要問題就是如何比較快速的得到比較準確的運動矢量,因為在整個視頻編碼的過程中,即使采用快速算法,運動估計仍然是耗時最長、資源占用最高的環(huán)節(jié),如在H.261的編碼過程中,在采用著名的三步快速搜索法的情況下,運動估計仍要占用整個編碼過程的63%的計算量;而在H.263編碼器中,運動估計也還占用了42%的計算量。因此,運動估計成了視頻壓縮編碼的瓶
35、頸,特別是對于幀幅較大、幀頻較高的視頻對象,在編碼實時性和硬件實現(xiàn)方面,運動估計還有很多潛力可挖?;谏鲜鲈颍咝Э焖俚倪\動估計算法一直是視頻壓縮編碼領(lǐng)域的研究熱點。從全搜索到三步搜索法、菱形搜索、以及六邊形搜索法等,提高了基于塊匹配的運動估計算法的性能,使實時應(yīng)用成為了可能,但是由于實際需求越來越高,所以也要求我們不斷的改進運動估計算法以滿足現(xiàn)實的需求。 基于塊匹配的運動估計作為視頻編碼的關(guān)鍵技術(shù),需要解決的問題是如何提高它的估算速度和精度。而魚和熊掌不能兼得,這兩個指標在實際計算過程中往往無法同時達到最優(yōu),如何解決這個折衷問題具有很高的理論和實際意義,是一個圖像處理領(lǐng)域和圖像通信領(lǐng)域極
36、其重要的研究課題。它的研究和應(yīng)用必將促進計算機通信、圖像通信和多媒體技術(shù)的發(fā)展。 本課題的意義在于,通過實驗和仿真,比較了各種算法的優(yōu)缺點,找出了最優(yōu)的算法,確保視頻壓縮的質(zhì)量。力求在己有算法的基礎(chǔ)上尋找一種新的思路,找出了一種優(yōu)化和改進的塊匹配運動估計算法,使其能夠在保證圖像質(zhì)量的同時,搜索速度得到較大的提高。 1.1.2 視頻壓縮技術(shù)介紹 對視頻進行壓縮,就要了解視頻的構(gòu)成。普通的未壓縮視頻都是由一幀幀圖像序列組成的,一般1秒中包含24幀圖像。一般圖像的變化都很小,而且變化都是局部的,甚至是靜止的,這樣就可以從中找到突破。數(shù)字視頻中的這些情況都可以稱為信息的冗余,因此可以通過除去這些
37、冗余數(shù)據(jù)來減少大量的原始視頻的數(shù)據(jù)量,從而達到數(shù)據(jù)壓縮以解決視頻傳輸中數(shù)據(jù)不便傳輸?shù)膯栴}。通常的視頻信息中存在以下三種冗余:[1] 空間冗余:這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。研究數(shù)據(jù)表明,圖像幀內(nèi)的行、列相鄰點之間的相關(guān)性可以達到90%以上。 時間冗余:這是視頻里圖像序列中最經(jīng)常包含的冗余。視頻序列前后幀之間存在著較大的相關(guān)性。同樣有研究證明活動圖像相鄰幀同一位置上前后樣值的相關(guān)性也達到90%以上。 視覺冗余:人類的視覺系統(tǒng)對圖像的敏感性是非均勻的和非線性的。人的視覺系統(tǒng)(HVS)對于某些失真并不敏感。然而,在記錄的原始圖像數(shù)據(jù)時,通常假設(shè)這個系統(tǒng)是均勻的和線性的,對視覺敏感和不
38、敏感的部分同等對待,從而產(chǎn)生了比理想編碼更多的數(shù)據(jù),這就是視覺冗余。 視頻信號都是由一系列單獨的圖像幀組成。每一幀都可以利用圖像編解碼器(JPEG)進行幀內(nèi)編碼(Intra-frame Coding),每一幀在內(nèi)部先進行編碼而沒有考慮到其它的幀。消除視頻序列中的時間冗余(連續(xù)視頻幀中的相似性),可以達到更好的壓縮效果。具體可以通過給圖像編解碼器增加一個“前后幀”來實現(xiàn),主要有以下的兩個功能: (1)預(yù)測:從一個或多個先前傳輸?shù)膸瑏斫Ξ斍皫念A(yù)測; (2)補償:從當前幀中減去預(yù)測幀來產(chǎn)生“殘差幀”。 接著用圖像編解碼器來處理這個殘差幀。經(jīng)過這個處理,殘差幀將包含很少的數(shù)據(jù),因而可以用
39、圖像解碼器對它進行有效的壓縮。為了解碼幀,解碼器必須進行逆反補償過程,把預(yù)測加到解碼的殘差幀中,這就是幀間編碼(Inter-frame Coding)。 視頻編碼標準的最重要的發(fā)展都是源于兩大標準組織:ITU(前身是CCITT)和ISO。 1986年,ISO和CCITT聯(lián)合成立了“聯(lián)合圖片專家組(JPEG Joint Photographic Experts Group)”,于1991年3月提交了用于灰度等級和顏色兩方面連續(xù)變化靜止圖像編碼的JPEG建議草案,于1992年7月通過證實標準。 1988年,MPEG(Moving Picture Expert Group)運動圖像專家組成立
40、,它致力于運動圖像及其伴音編碼標準化的工作,包括MPEG系統(tǒng),即MPEG視頻和MPEG音頻。原先共有三個版本MPEG-1,MPEG-2,MPEG-3,后來又增加了MPEG-4,MPEG-7等,不同的版本對應(yīng)了不同的應(yīng)用場合及相關(guān)的視頻質(zhì)量,對多媒體通信的發(fā)展起到了巨大的影響。[2] (1)MPEG-1 MPEG-1制定于1993年,是針對1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲媒質(zhì)運動圖像及其伴音編碼的國際標準。MPEG-1用于在CD-ROM上存儲同步和彩色運動視頻信號,可優(yōu)化為中等分辨率,并在這個優(yōu)化模式下,采用標準交換格式(SIF)。它可針對SIF標準分辨率(對于NTSC制為352240
41、;對于PAL制為352288)的圖像進行壓縮,傳輸速率為1.5Mbits/sec,每秒播放30幀。MPEG-1對色差分量采用4:1:1的二次采樣率。MPEG-1旨在達到VRC質(zhì)量,其視頻壓縮率為26:1。 (2)MPEG-2 MPEG-2制定于1995年,它追求的是CCIR 601建議的圖像質(zhì)量DVB,HDTV和DVD等制定的3Mbps~10Mbps的運動圖像及其伴音的編碼標準。MPEG-2在NTSC制式下的分辨率可達720486,MPEG-2能夠提供廣播級的視像和CD級的音質(zhì)。由于MPEG-2在設(shè)計時的巧妙處理,使得大多數(shù)MPEG-2解碼器可播放MPEG-1格式的數(shù)據(jù)。正因為MPEG-2
42、的出色性能表現(xiàn),已能適用于HDTV。除了做為DVD的指定標準外,MPEG-2還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級的數(shù)字視頻。還可提供一個較廣的范圍改變壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲容量以及帶寬的要求。對于最終用戶來說,由于現(xiàn)存電視機分辨率的限制,MPEG-2所帶來的高清晰度畫面質(zhì)量(如DVD畫面)在電視上效果并不明顯,反而其音頻特性(如加重低音,多伴音聲道等)更引人注目。 (3)MPEG-3 MPEG-3是ISO/IEC最初為HDTV開發(fā)的編碼壓縮標準。但由于MPEG-2的高速發(fā)展,MPEG-3的功能已被淘汰,其原來的工作由MPEG-2小組承擔。 (4)MPEG-
43、4 MPEG-4于1998年11月公布,該標準提出了基于對象編碼的概念,不僅針對一定比特率下的視頻編碼、音頻編碼,更加注重于多媒體系統(tǒng)的交互性和靈活性。MPEG-4標準主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以最少的數(shù)據(jù)能取得最佳的圖像質(zhì)量。MPEG-4是第一個讓用戶由被動變?yōu)橹鲃拥膭討B(tài)圖像標準,從根源上說,MPEG-4將自然物體與人造物體相溶合(視覺效果意
44、義上的),其試圖達到兩個目標:低比特率下的多媒體通信及多工業(yè)的多媒體通信的綜合。據(jù)此目標,MPEG-4引入了AV對象(Audio/Visual Objects),從而使得更多的交互操作成為可能。 MPEG-4的應(yīng)用前景可以說非常廣闊。它的出現(xiàn)能推動以下的幾個方面:數(shù)字電視、動態(tài)圖像、萬維網(wǎng)(WWW)、實時多媒體監(jiān)控、低比特率下的移動多媒體通信、Internet/Intranet上的視頻流與可視游戲、基于面部表情模擬的虛擬會議、DVD上的交互多媒體應(yīng)用、基于計算機網(wǎng)絡(luò)的可視化合作實驗室場景應(yīng)用等。 MPEG-4技術(shù)還在不斷的完善和發(fā)展當中,新的MPEG-4標準的應(yīng)用正在促進多媒體壓縮技術(shù)經(jīng)歷
45、另一次重大變化。這一變化會與1990年MPEG-2壓縮標準的推出一樣巨大,而且隨著視頻通信應(yīng)用的快速發(fā)展,MPEG-4標準勢會影響到范圍廣泛的多種應(yīng)用領(lǐng)域。 (5)MPEG-7 繼MPEG-4之后,要解決的矛盾就是對日漸龐大的圖像、聲音信息的管理和迅速搜索。針對這個矛盾,MPEG提出了這個解決方案MPEG-7。MPEG-7力求能夠快速并且有效地搜索出用戶所需的不同類型的多媒體信息。該標準沒有規(guī)定利用描述進行搜索的工具或任何程序。 目前MPEG系列國際標準已經(jīng)成為影響最大的多媒體技術(shù)標準,對數(shù)字電視、視聽消費電子產(chǎn)品、多媒體通信等產(chǎn)業(yè)產(chǎn)生了深遠影響。 ITU主要精力則集中在支持實時、雙向
46、視頻通信上。而負責發(fā)展這些標準的組織就是眾所周知的VCEG(視頻編碼專家組),其主要標準有: (1) H.261視頻編碼標準 H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)而制定的,速率為64kb/s的整數(shù)倍。H.261只對CIF和QCIF兩種圖像格式進行處理,每幀圖像被分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。H.261是最早的運動圖像壓縮標準,包括運動補償?shù)膸g預(yù)測、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。 (2) H.263視頻壓縮標準 H.263是ITU-T為低于64kb/s的窄帶通信信道而制
47、定的視頻編碼標準。它的標準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運動補償,且增加了4種有效的壓縮編碼模式。 先進的預(yù)測模式允許一個宏塊中4個88亮度塊各對應(yīng)一個運動矢量,提高了預(yù)測精度;兩個色度塊的運動矢量取這4個亮度塊運動矢量的平均值。補償時,88亮度塊每個象素的補償值由3個預(yù)測值加權(quán)平均而得到。使用這個模式可以產(chǎn)生顯著的編碼增益,特別是采用重疊的塊運動補償后,能減少塊效應(yīng),提高主觀質(zhì)量。 (3) H.264視頻壓縮標準 H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT
48、)制定的新一代視頻壓縮編碼標準。它的主要優(yōu)點列出如下:在相同重建圖像質(zhì)量下,H.264比H.263+和MPEG-4(SP)減小50%的碼率。既可工作于低時延的模式以滿足實時業(yè)務(wù),如會議電視;又可工作于無時延限制的場合,如視頻存儲。在編/解碼器中采用復(fù)雜度可分級設(shè)計,在圖像質(zhì)量和編碼處理之間可分級,以適應(yīng)不同復(fù)雜度的場合。 相對于早期的視頻壓縮標準,H.264引入了許多相對先進的技術(shù),包括44的整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測、1/4象素精度的運動估計、多參考幀與多種大小塊的幀間預(yù)測技術(shù)等。新技術(shù)帶來了較高的壓縮比,同時大大的提高了算法的復(fù)雜度。 視頻編碼通過去除圖像的空間與時間相關(guān)性來達到數(shù)據(jù)壓
49、縮的目的。空間相關(guān)性可以通過有效的變換來去除,如DCT變換、H.264的整數(shù)變換;時間相關(guān)性則通過幀間預(yù)測來去除。這里所說的變換去除空間相關(guān)性,僅僅局限在所變換的塊內(nèi),如88或者44,并沒有塊與塊之間的處理。H.263+與MPEG-4則引入了幀內(nèi)預(yù)測技術(shù),在變換域中根據(jù)相鄰塊對當前塊的某些系數(shù)做預(yù)測。H.264則是在空域中,利用當前塊的相鄰象素直接對每個系數(shù)做預(yù)測,有效地去除相鄰之間的相關(guān)性,極大地提高了幀內(nèi)編碼的效率。 1.2 運動估計的研究現(xiàn)狀 運動估計算法通常分為兩大類:一類是象素遞歸算法PRA(Pixel Recursive Algorithm);另一類是塊匹配算法BMA(Blo
50、ck Matching Algorithm)。PRA是基于遞歸思想,如果連續(xù)幀中象素數(shù)據(jù)的變化是因為物體的移位引起的,算法就會沿著梯度方向?qū)δ硞€象素周圍的若干象素做迭代運算,使連續(xù)的運算最后收斂于一個固定的運動估計矢量,從而預(yù)測該象素的位移;而BMA則是基于當前幀中一定大小的塊,在當前幀的前后幀的一定區(qū)域內(nèi)搜索該象素塊的最佳匹配塊,作為它的預(yù)測塊。盡管PRA對比較復(fù)雜的運動形式來說,其預(yù)測精度要高于BMA,但是由于其計算量比BMA大的多,同時BMA本身也擁有較好的性能,因此目前的視頻壓縮編碼國際標準普遍都采用BMA。 本文的研究都是針對塊匹配的運動估計算法,在后文中,如無特別說明,所提到的運
51、動估計也都是指基于塊匹配的運動估計。 在基于塊匹配的運動估計中,最直接的是全搜索算法(Full Search,F(xiàn)S),它能夠得到全局最優(yōu)的運動矢量,但該算法的運算量也相當巨大,成為了編碼器實時應(yīng)用的瓶頸。為了提高運動估計的運算速度,人們不斷提出針對塊匹配運動估計的改進快速算法,其目標是在保證編碼質(zhì)量的同時,盡可能的降低運算復(fù)雜度。 快速搜索模板這類算法的主要想法是通過在搜索窗口內(nèi)按照固定的搜索模板和步驟,對較少的幾個點進行匹配運算來降低運算復(fù)雜度,這類快速模板算法都是基于一個共同的假設(shè),即在搜索窗內(nèi)有且僅有一個全局匹配誤差最小點,而且匹配誤差隨著當前點與全局最優(yōu)點之間距離的增大而增大。模板
52、搜索快速算法是提出最早,發(fā)展最為成熟,也是應(yīng)用最為廣泛的一類快速算法。它的優(yōu)點是算法簡單,計算量小,加速比較大,缺點是容易陷入局部最優(yōu)值,尤其在大運動情況下,搜索的準確度難以保證。 該類算法的經(jīng)典代表有三步法[3](Three step seareh,TSS)、2維對數(shù)法[4] (2-Dime nsion Logarithm,2D-LOG)、新三步法[5](New Three step seareh,NTSS)、四步法[6](Four Step Seareh,F(xiàn)SS)、菱形法[7](Diamond Seareh,DS)、六邊形搜索法[8](Hexagon- Based seareh,HEXB
53、S)等。 1.3 本文主要內(nèi)容和工作安排 本論文的主要工作就是在基于塊匹配的視頻圖像運動估計技術(shù)研究的基礎(chǔ)上,深入分析、全面總結(jié)現(xiàn)有的經(jīng)典塊匹配運動估計算法,并通過仿真實驗比較他們的性能。在此基礎(chǔ)上,力爭提出一種優(yōu)化和改進后的塊匹配運動估計算法,使其能夠在保證圖像質(zhì)量的同時,搜索速度得到較大的提高。 本論文章節(jié)安排如下: 第1章 緒論。通過查閱大量的相關(guān)文獻,介紹了課題的背景與研究的重要意義,然后對視頻壓縮技術(shù)也進行了簡要介紹,最后介紹了運動估計的研究現(xiàn)狀。 第2章 運動估計概述及其技術(shù)指標。介紹了運動估計的思想,著重分析了塊匹配運動估計的原理,對塊匹配運動估計的幾項重要的技術(shù)指標(
54、分塊的大小,匹配準則,搜索范圍,估計精度)的確定進行了重點討論。 第3章 典型塊匹配運動估計算法分析。詳細闡述了各種經(jīng)典塊匹配運動估計算法,并從搜索算法在搜索速度、計算量、匹配質(zhì)量、等方面的性能進行了分析比較。最后通過仿真、實驗數(shù)據(jù)定量地評價了各算法的優(yōu)缺點。 總結(jié)與展望??偨Y(jié)了全文的研究成果,并對運動估計算法研究進行了展望,提出了進一步的研究工作。 第2章 運動估計概述及其技術(shù)指標 由于視頻序列圖像在時間上具有較強的相關(guān)性,運動估計(ME)及運動補償(MC)技術(shù)可以有效的減少時間相關(guān)性,因此該技術(shù)被廣泛應(yīng)用于各種視頻壓縮編碼方案中。運動估計用來估計物體的位移,得到運動矢量;運動補償根
55、據(jù)得到的運動矢量,對前一幀中由于運動而產(chǎn)生的位移進行調(diào)整,從而得到盡可能接近本幀的預(yù)測幀。由此可見,運動估計算法越完善,估計出的運動矢量越準確,運動補償?shù)男阅芫驮胶?,從而使預(yù)測誤差越小,編碼后需要傳輸?shù)男畔⒘恳矊㈦S之大大減少,整個系統(tǒng)的碼率壓縮比就會得到很大的提高,因此運動估計和補償技術(shù)己經(jīng)成為視頻序列圖像編碼系統(tǒng)中減少時間冗余、提高壓縮比的重要技術(shù)。H.26x和MPEG-1,MPEG-2,MPEG-4等標準采用的都是基于塊匹配運動估計與運動補償?shù)膸g壓縮方案,其壓縮比和基于幀內(nèi)壓縮的標準(如JPEG)相比有較大的提高。 典型的視頻壓縮編解碼系統(tǒng)如圖2-1所示,運動估計算法實現(xiàn)幀間編解碼的基
56、本過程是這樣的:在編碼端,如圖2-1(a)所示當前幀與幀存器里的參考幀先進行運動估計,得到當前幀的運動矢量,運動矢量與參考幀又補償出當前幀的預(yù)測幀,預(yù)測幀與當前幀相減得到預(yù)測誤差,然后對預(yù)測誤差進行DCT變換和量化,最后,把運動矢量和量化后的DCT信息一起進行變長編碼,同時,量化后的DCT信息又經(jīng)過反量化、IDCT變換得到預(yù)測誤差,預(yù)測誤差與先前的預(yù)測幀相加得到當前幀,存入幀存器作為下一幀的參考幀。 (a)編碼器 (b)解碼器 圖2-1 典型的視頻壓縮編解碼系統(tǒng) 在解碼端,如圖2-1(b)所示,壓縮碼流經(jīng)過變長解碼分成兩部分:運動矢量和預(yù)測誤差的逆信息,然后將預(yù)測誤差的逆信息經(jīng)
57、過反量化、IDCT變換得到預(yù)測誤差,將運動矢量與幀存器里的前一幀進行運動補償?shù)玫筋A(yù)測幀,再將預(yù)測幀與預(yù)測誤差相加就得到了當前幀的重構(gòu)圖像,同時保存到幀存器里作為下一幀的參考幀。 在視頻壓縮編碼中,即使采用快速算法,運動估計仍是最費時的環(huán)節(jié),如在H.261的編碼過程中,在采用著名的三步快速搜索法的情況下,運動估計仍要占用整個編碼過程的63%的計算量;而在H.263編碼器中,運動估計占用了42%的計算量。因此,運動估計是視頻壓縮的瓶頸。 基于上述原因,高效快速的運動估計算法一直是視頻壓縮領(lǐng)域的研究熱點。尤其是從1997年10月召開的MPEG會議上開始征集運動估計快速算法以來,在視頻編碼中的運動
58、估計算法的研究領(lǐng)域中競爭日益激烈。 2.1 運動估計 對于視頻序列圖像,由于相鄰幀間存在很大的時間相關(guān)性,即時間兀余(Temp- oral Redundancy)。所以減少時間冗余,可以大幅度提高視頻壓縮編碼的效率。這方面一種有效的方法就是基于塊匹配的運動估計(Motion Estimation,ME),因為算法簡單,便于實現(xiàn)等優(yōu)點而得到廣泛的應(yīng)用。其基本思想是將圖像序列的每一幀分成M*N的宏塊,然后對于當前幀中的每一塊根據(jù)一定的匹配準則在前一幀或后一幀中在給定的搜索范圍內(nèi)找出與當前塊最相似的塊,即匹配塊,根據(jù)匹配塊與當前塊的相對位置計算出運動位移,所得運動位移既為當前塊的運動矢量。運
59、動估計的越準確,補償?shù)臍埐罹驮叫。幋a效率就越高,解碼出來的圖像質(zhì)量就越好。 運動估計用于幀間編碼方式時,通過參考幀圖像產(chǎn)生對被壓縮圖像的估計。運動估計是以宏塊為單位進行,計算被壓縮圖像與參考圖像的對應(yīng)位置上的宏塊間的位置偏移。這種位置偏移是以運動矢量來描述的,一個運動矢量代表水平和垂直兩個方向上的位移。 圖2-2 宏塊、搜索區(qū)域與運動矢量的關(guān)系 運動估計及補償?shù)幕驹砭褪抢脦g運動估計得到待編碼塊的一個參考塊,然后用這個參考塊進行運動補償,將補償后的殘差進行DCT變換和可變長編碼。運動估計的主要過程如圖2-2所示。這樣運動補償方法是基于局部運動估計的,它對圖像中的宏塊進行操作,
60、在參考幀圖像的搜索范圍內(nèi),搜索與當前幀最接近的宏塊,從而得到這個宏塊的運動矢量。運動矢量是一個包括水平和垂直分量的二維矢量,編碼過程只對這個運動矢量和當前宏塊與在參考幀中搜索到的宏塊的差值就行編碼。運動估計越準確,那么所要編碼的殘差圖像就越小,運動補償編碼所需要的位數(shù)就越少。另外,如果運動估計的搜索采用全搜索法,它占用了編碼過程中程序運行的大部分時間,所以為了提高搜索速度和效率,搜索策略也很重要。目前研究最多的快速搜索算法,有三步法、四步法、新三步法、菱形法等,這些算法將在第三章詳細介紹。 2.2 塊匹配運動估計的基本原理 運動估計可以看作是對相鄰圖像幀時域相關(guān)性的檢測,通過對相鄰圖像幀之
61、間相似部分的搜尋來獲得圖像中景物對象的運動信息。運動估計和補償?shù)幕具^程是通過一定的方法在參考幀圖像中搜索當前幀圖像的運動信息,再根據(jù)這些運動信息在參考圖像上進行相應(yīng)的運動補償操作,得到一個當前幀的重構(gòu)圖像。由于運動估計時得到了當前圖像與參考圖像的相關(guān)信息,這個重構(gòu)圖像與當前圖像的差值往往比直接用參考圖像和當前圖像作差而得到的比特數(shù)要少得多,因此,運動估計與補償技術(shù)能有效減少相鄰幀之間的數(shù)據(jù)冗余,從而獲得更高的壓縮比,降低視頻壓縮編碼后的碼率。 運動估計的一個基本問題是如何選擇運動信息的表示方式,這又與運動估計的算法模型密切相關(guān)。最直接的方法是對于每一個當前幀的像素都采用一個二維矢量(由于我
62、們這里討論的都是針對二維圖像的運動估計,因此每個被估計的圖像單元的運動信息都可以表示為一個由水平方向分量和垂直方向分量構(gòu)成的二維矢量)來表示其運動信息,即我們通常所稱的運動矢量。這種方法具有普遍的適用性,但是由于視頻圖像通常具有非常多的像素,這樣對每一個像素都進行運動估計是不現(xiàn)實的,同時這樣得到的運動矢量場的數(shù)據(jù)量太大而使得總的編碼比特反而不能減少。因此,在實際中,我們一般將圖像幀分割為許多互不重疊的宏塊,并假定宏塊中的所有像素做相同的平動,這樣就可以分別對每個宏塊獨立地估計其運動信息參數(shù)即運動矢量,這就是目前在各種主流的視頻壓縮標準(如MPEG-4、H.264等)中被廣泛應(yīng)用的基于塊匹配的運
63、動估計方法。這種方法在運動估計精度與計算復(fù)雜度之間提供了一個較好的折衷,其基本原理如圖2-3所示。 在對某一幀圖像進行運動估計時,首先將其按照一定的方式劃分成互不重疊的若干個宏塊,設(shè)宏塊的大小為M*N(H.263、MPEG-2和MPEG-4建議采用M=N=16,而H.264則可采用幾種不同大小的宏塊模式進行估計),然后再對每幀中的宏塊依次進行運動估計,獲得各自的運動矢量。在基于塊匹配運動估計和補償?shù)囊曨l壓縮編碼系統(tǒng)中,宏塊是進行DCT變換、量化、運動估計、運動補償及圖像重建等操作的基本單元,即在運動預(yù)測編解碼過程中均以宏塊作為操作的單位。 圖2-3 塊匹配運動估計原理示意圖 為了便于
64、說明塊匹配算法的基本原理,設(shè)當前幀中的某目標宏塊左上角像素點的坐標為:s=(x,y)。需要說明的是,由于假設(shè)宏塊中的所有像素都作相同的平移運動,因此宏塊中的任意一點都可以標明其位置。然后,在參考幀中,以待估計宏塊的位置坐標s為中心,在水平方向分別向左和向右擴展一定長度的搜索距離,而在垂直方向分別向上和向下擴展,則可得到一個大小為的搜索窗砰。搜索窗中的每一個點都對應(yīng)著一個候選匹配宏塊,設(shè)某個候選宏塊的左上角像素點的坐標為,則該候選宏塊相對于目標宏塊的偏移量mv就是該搜索點對應(yīng)的運動矢量,即: (2-1) 塊匹配運動估計的目的是在搜索窗中搜尋與目標宏塊最為匹配的候選宏
65、塊,并獲得相應(yīng)的運動矢量。其中,搜索窗的大小由視頻中景物對象的運動速度決定。對象的運動速度越塊,搜索窗也應(yīng)越大,即和的取值需加大,以覆蓋更大的運動范圍,從而獲得更高的預(yù)測精度。不過,較大的搜索窗通常會使得搜索點增多,從而加大計算量,因此,搜索距離的設(shè)定需綜合考慮具體視頻的運動特性、運動估計的質(zhì)量以及算法的計算量等因素,以獲得最佳的估計性能。 2.3 塊匹配的運動估計的參數(shù)和指標 基于塊匹配的運動估計算法,在具體實現(xiàn)的時候,需要考慮其中的幾個參數(shù):分塊大?。∕,N取值),匹配準則,搜索范圍和估計精度。其中每一個都對匹配的效率產(chǎn)生重要影響,有些則是最關(guān)鍵的。 2.3.1 分塊大小 上面已經(jīng)
66、提到過一點,塊匹配法有個前提,就是同一個塊內(nèi)的像素運動方向是一致的。因此需要選擇合適的塊大小。塊大小大時,塊內(nèi)各像素作平移運動的可能性比較小,不滿足我們的前提條件,會影響估計的精度;塊大小小時,會受噪聲影響,結(jié)果不準確,而且還會導(dǎo)致產(chǎn)生許多運動矢量,使得運算量增加,降低了編碼的效率。所以塊的大小必須選擇合適,滿足上面的要求。當前的視頻壓縮標準,如H.26x和MPEG一般以1616大小的塊作為一個宏塊,這是一個已經(jīng)證明的較好的平衡結(jié)果。而且H.263和MPEG-4在進行1616的宏塊運動估計的基礎(chǔ)上,還加入了88塊的處理,使得預(yù)測的精度有了提高。H.264更是最小分塊達到了44,進一步使得運動估計的結(jié)果精確。 2.3.2 匹配準則 塊匹配準則是判斷塊相似程度的算法和標準,準則的好壞直接影響了運動估計的結(jié)果。而且匹配運算、數(shù)據(jù)讀取復(fù)雜度很大程度上決定于所采用的塊匹配準則。在塊匹配法中,有三種最優(yōu)匹配準則: (1)最小絕對差MAD(Mean Absolute Difference)、 (2-2) MAD值最小時為最優(yōu)的匹配點。 (2)最小均方
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)備采購常用的四種評標方法
- 車間員工管理須知(應(yīng)知應(yīng)會)
- 某公司設(shè)備維護保養(yǎng)工作規(guī)程
- 某企業(yè)潔凈車間人員進出管理規(guī)程
- 企業(yè)管理制度之5S管理的八個口訣
- 標準化班前會的探索及意義
- 某企業(yè)內(nèi)審員考試試題含答案
- 某公司環(huán)境保護考核管理制度
- 現(xiàn)場管理的定義
- 員工培訓程序
- 管理制度之生產(chǎn)廠長的職責與工作標準
- 某公司各級專業(yè)人員環(huán)保職責
- 企業(yè)管理制度:5S推進與改善工具
- XXX公司環(huán)境風險排查及隱患整改制度
- 生產(chǎn)車間基層管理要點及建議