數(shù)字視頻信號源的編碼器和解碼器的研究
《數(shù)字視頻信號源的編碼器和解碼器的研究》由會員分享,可在線閱讀,更多相關《數(shù)字視頻信號源的編碼器和解碼器的研究(21頁珍藏版)》請在裝配圖網上搜索。
課程設計說明書 第19頁 摘 要 數(shù)字視頻/音頻壓縮編碼是數(shù)字電視廣播系統(tǒng)中非常重要的環(huán)節(jié),主要解決電視信號數(shù)字化后所帶來的海量數(shù)據量如何能夠有效地存儲和傳輸?shù)膯栴}。近20年來,視頻/音頻壓縮編碼技術一直處于快速發(fā)展之中,新技術和新標準不斷涌現(xiàn),現(xiàn)代視頻/音頻壓縮編碼技術已經比較成熟,可以在保持較好圖像質量前提下,達到較高的壓縮比。 數(shù)字化技術的發(fā)展和成熟已使數(shù)字高清晰度電視(HDTV)成為現(xiàn)實。高清晰度電視是新一代電視,其掃描線在1000行以上,每行1920個像素,寬高比為16:9,較常規(guī)電視更符合人們的視覺特性,使圖像質量與35mm首映電影相當。但是由于像素數(shù)大幅度增加,使本來數(shù)碼位就較高的二進制編碼形成極大的編碼數(shù)據,使HDTV的信息量可達常規(guī)電視的5倍以上,傳輸時占用頻帶寬,存儲時占用媒體容量大,特別是對計算量最為龐大的運動估算的運動算法來說,編碼器無疑要有非常高的處理速度,這樣給實際應用開發(fā)帶來了極大困難。因此,必須對HDTV圖像進行壓縮編碼。本文主要針對數(shù)字視頻信號源的編碼器和解碼器的研究。 關鍵詞:視頻/音頻壓縮編碼技術 ,編碼器,譯碼器 目 錄 1數(shù)字電視的優(yōu)點和發(fā)展概況及其基本結構 1 1.1數(shù)字電視的優(yōu)點和發(fā)展概況 1 1.2數(shù)字電視的基本組成 3 2視頻壓縮編碼的方法 3 2.1莫爾斯碼與信源編碼 4 2.2差值脈沖編碼 4 2.3預測編碼基本原理 4 2.4游程長度編碼 6 2.5霍夫曼編碼 7 2.6運動估計的運動補償編碼 8 3 MPEG-2編碼器原理 10 3.1 MPEG-2的編碼方式 10 3.2 PAL解碼器 13 3.3 MPEG-2視頻編碼器 14 4 MPEG-2解碼器原理 15 4.1視頻基本碼流結構 15 4.2 MPEG-2解碼 16 總 結 17 致 謝 18 參考文獻 19 1數(shù)字電視的優(yōu)點和發(fā)展概況及其基本結構 1.1數(shù)字電視的優(yōu)點和發(fā)展概況 數(shù)字電視是高科技的產物,數(shù)字電視是指電視節(jié)目的采集、制作、編輯、播出、傳輸、接收的全過程都采用數(shù)字技術。與模擬電視相比,數(shù)字電視在技術上具有以下優(yōu)勢和特點: (1)、清晰度高、音頻效果好、抗干擾能力強。數(shù)字電視信號在傳輸過程中不會出現(xiàn)噪聲積累效應,幾乎完全不受噪聲干擾,電視信號的強度衰減與失真度很低,電視畫面十分逼近演播室水平。數(shù)字電視的音頻效果很好,支持五聲道的杜比數(shù)碼(AC-3)5.1環(huán)繞立體聲家庭影院服務; (2)、數(shù)字頻道數(shù)成倍增加?;诂F(xiàn)有模擬電視頻道,可同時傳輸6-8套DVD質量或15-18套VCD質量的數(shù)字電視節(jié)目。如全部采用數(shù)字電視技術傳輸,可同時傳送大約200套DVD質量或500多套VCD質量的電視節(jié)目。電視頻道資源利用率高,可完全滿足用戶自由收看電視節(jié)目的個性化要求; (3)、數(shù)字業(yè)務功能極大拓展。隨著有線電視傳輸和用戶接收的數(shù)字化,以前模擬方式無法提供的服務都將成為可能,如電視網站、交互電視、股票行情與分析、視頻點播等,電視互動數(shù)字新業(yè)務的開展將變得更加容易; (4)、數(shù)字電視信號容易加密,保密性好,便于采用現(xiàn)代數(shù)字信號處理??傊?,數(shù)字電視替代模擬電視的趨勢是現(xiàn)代科技發(fā)展的必然結果。 數(shù)字電視在我國具有強大的國家、政府支持和重視優(yōu)勢,就廣播電視行業(yè)發(fā)展而言,數(shù)字電視技術為滿足人民群眾日益增長的精神文化需求提供強有力的技術和市場基礎,為廣播電視事業(yè)的大繁榮大發(fā)展帶來了歷史良機,因此受到廣電行業(yè)的高度重視和大力推進,并取得快速的發(fā)展。截止到2008年,全國有線數(shù)字電視整體轉換城市超過100個,其中33個城市實現(xiàn)全市用戶數(shù)字化整轉,全國數(shù)字電視用戶已達4450萬戶。 圖1.1顯示我國數(shù)字電視用戶在2003-2008年間的快速發(fā)展規(guī)模和占全國電視用戶量的比例,5年用戶增長了158.9倍,比例增長了13個百分點。圖1.2、表1.1則給出了華北等六個地區(qū)2007-2008兩年的數(shù)字電視用戶及在本地區(qū)所占 圖1.1 2003-2008年全國數(shù)字電視用戶規(guī)模和所占比例圖 比例的發(fā)展情況,其中華北地區(qū)發(fā)展的最快提高了12.9個百分點,西北地區(qū)提高了11.7個百分點,最少的東北地區(qū)也提高了4個百分點。另據國內In-Stat和絡達咨詢的研究報告,預計到2009年底我國數(shù)字電視規(guī)模將達8522萬戶,2010年將達到1.0284億戶,2011年將達到1.1165億戶,2012年將達到1.1606億戶。 圖1.2 2007年與2008年不同地區(qū)數(shù)字電視用戶所占比例 雖然我國數(shù)字電視在發(fā)展上具備很多優(yōu)勢,但與發(fā)達國家相比,我國數(shù)字電視整體上仍然處在發(fā)展的初期階段,尚存在很多的問題。概括的說,有廣電體制方面因素,條塊分割、性質單一,既難統(tǒng)一規(guī)劃、布局與實施,又難以引入市場競爭;有政策指導方面的因素,地域差異經濟發(fā)展不平衡導致受眾需求差別大而難以指導;有技術方面的缺乏配套齊全、規(guī)范和可操作的技術標準因素;有市場運營方面投、融資、運行成本高,難以短期盈利的因素;也有運營模式、產業(yè)規(guī)范、業(yè)務性質等等因素形成的問題。應該說我國數(shù)字電視的發(fā)展是機遇與挑戰(zhàn)并存,只要我們按照科學規(guī)律辦事,充分發(fā)揮中國特色社會主義的體制優(yōu)勢、行業(yè)優(yōu)勢、產業(yè)和市場優(yōu)勢,汲取發(fā)達國家發(fā)展數(shù)字電視所遇到的經驗與教訓,規(guī)避市場風險,就一定能推動我國數(shù)字電視的大發(fā)展。 表1.1 2007年與2008年不同地區(qū)數(shù)字電視用戶所占比較 1.2數(shù)字電視的基本組成 交互式數(shù)字電視系統(tǒng)由三部分組成:數(shù)字前端系統(tǒng)、雙向傳輸網絡和用戶終端系統(tǒng)。 數(shù)字前端系統(tǒng)通常劃分為信源處理、信息處理和傳輸處理三部分,完成節(jié)目的數(shù)字化、加擾、授權和認證等功能;雙向傳輸網絡主要通過衛(wèi)星、Cable、地面發(fā)射、MMDS等方式將節(jié)目傳送到用戶家中,回傳可采用HFC回傳通道、PSTN和其它網絡;用戶終端系統(tǒng)采用機頂盒(STB)收看數(shù)字電視節(jié)目或實現(xiàn)交互式功能,如收看付費電視、實現(xiàn)Internet瀏覽、遠程教育等。 2視頻壓縮編碼的方法 壓縮編碼的方法有幾十種之多,并在編碼過程中涉及較深的的數(shù)學里理論基礎問題,在此僅介紹幾種常用的壓縮編碼方法。 2.1 莫爾斯碼與信源編碼 莫爾斯碼即電報碼,其精華之處在于用短碼來表示常出現(xiàn)的英文字母,用長碼來表示不常出現(xiàn)的字母,以減小碼率。 2.2差值脈沖編碼 其原理框圖見圖2.1(a)。發(fā)端將當前樣值和前一樣值相減所得差值經量化后進行傳輸,收端將收到的差值與前一個樣值相加得到當前樣值。在這個原理圖中,輸出的當前樣值是輸出的前一樣值加上收到的差值,由于在當前差值中包括當前的量化誤差,而輸出的前一樣值又包括前一樣值的量化誤差,這就造成了量化誤差的積累。因此實用電路為圖2.1(b)。這時輸入當前樣值不是與輸入的前一樣值相減,而是與輸出的前一樣值相減,因此在差值中已經包含了前一樣值的量化誤差的負值,在與輸出的前一個樣值相加時,這部分量化誤差被抵消,只剩下當前的量化誤差,這就避免了量化誤差的積累。 圖2.1差值脈沖編碼 2.3 預測編碼基本原理 由于語音信號的相鄰抽樣點之間有一定的幅度關聯(lián)性,所以,可根據以前時刻的樣值來預測現(xiàn)時刻的樣值,只要傳預測值和實際值之差,而不需要每個樣值都傳輸。這種方法就是預測編碼。 語音信號的樣值可分為可預測和不可預測兩部分。可預測部分(相關部分)是由過去的一些權值加權后得到的;不可預測的部分(非相關部分)可看成是預測誤差。這樣,在數(shù)字通信中,就不用直接傳送原始話音信號序列,而只傳送差值序列。因為差值序列的信息可以代替原始序列中的有效信息,而差值信號的能量遠小于原樣值,就可以使量化電平數(shù)減少,從而大大地壓縮數(shù)碼率。在接收端,只要把差值序列疊加到預測序列上,就可以恢復原始序列。 圖2.2給出了差值脈碼調制(DPCM)系統(tǒng)原理框圖。圖中輸入樣值信號,接收端重建信號為,是輸入信號與預測信號的差值,為量化后的差值,是經編碼后輸出的數(shù)字碼。 圖2.2DPCM原理方框圖 編碼器中的預測器與解碼器中的預測器完全相同。因此,在無傳輸誤碼的情況下,解碼器輸出的重建信號和編碼器的完全相同。DPCM的總量化誤差定義為輸入信號與解碼器輸出的重建信號的差值。即有 由上式可知,在這種DPCM系統(tǒng)中,總量化誤差只和差值信號的量化誤差有關。圖2.3說明了預測的原理。 圖2.3 DPCM預測原理 由圖2.3可見,預測值跟蹤輸入信號抽樣值變化。DPCM的方框圖如圖2.3中,它是典型的線性預測方式。 設原始信號序列為,其中是序列中現(xiàn)在的樣值,而是的前個樣值。若選用的前N個樣值來預測,并用表示預測值,則 其中,j為任意整數(shù)。為預測系數(shù)或加權系數(shù),為預測階數(shù)。由上式可見,線性預測中,第n個預測值是過去N個樣值的線性組合。 2.4 游程長度編碼 讀出數(shù)據和表示數(shù)據的方式也是減少碼率的一個重要因素。讀出的方式可以有多種選擇 ,如水平逐行讀出、垂直逐列讀出、之字型讀出和交替讀出等,其中之字型讀出(Zig-Zag) 是最常用的一種。由于經DCT變換以后,系數(shù)大多數(shù)集中在左上角,即低頻分量區(qū),因此之字型讀出實際上是按二維頻率的高低順序讀出系數(shù)的,這樣一來就為游程長度編碼(Runleng th Encoding)創(chuàng)造了條件。所謂游程長度編碼是指一個碼可同時表示碼的值和前面幾個零,這樣就可以把之字型讀出的優(yōu)點顯示出來了。因為之字型讀出在大多數(shù)情況下出現(xiàn)連零的機 會比較多,尤其在最后,如果都是零,在讀到最后一個數(shù)后只要給出“塊結束”(EOB)碼,就可以結束輸出,因此節(jié)省了很多碼率。 游程長度指的是由字構成的數(shù)據流中各個字符連續(xù)重復出現(xiàn)而形成字符串的長度?;镜挠纬叹幋a就是在數(shù)據流中直接用三個字符來給出上述三種信息,其數(shù)據結構如圖2.4所示。 圖2.4基本游程長度編碼數(shù)據結構 CS表示有一個字符串在此位置,X代表構成串的字符,SC代表串的長度。游程編碼和哈夫曼編碼等屬于統(tǒng)計編碼。 2.5霍夫曼編碼 霍夫曼編碼是可變字長編碼(VLC)的一種。Huffman于1952年提出一種編碼方法,該方法完全依據字符出現(xiàn)概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,一般就叫作Huffman編碼。下面引證一個定理,該定理保證了按字符出現(xiàn)概率分配碼長,可使平均碼長最短。 定理:在變字長編碼中,如果碼字長度嚴格按照對應符號出現(xiàn)的概率大小逆序排列,則其平均碼字長度為最小。 現(xiàn)在通過一個實例來說明上述定理的實現(xiàn)過程。設將信源符號按出現(xiàn)的概率大小順序排列為 : 給概率最小的兩個符號a6與a7分別指定為“1”與“0”,然后將它們的概率相加再與原來的 a1~a5組合并重新排序成新的原為: 對a5與a6′分別指定“1”與“0”后,再作概率相加并重新按概率排序得U″:(0.26 0.20 0.19 0.18 0.17)…直到最后得 U″″:(0.61 0.39)分別給以“0”,“1”為止,如圖2.5所示。 霍夫曼編碼的具體方法:先按出現(xiàn)的概率大小排隊,把兩個最小的概率相加,作為新的概率 和剩余的概率重新排隊,再把最小的兩個概率相加,再重新排隊,直到最后變成1。每次相 加時都將“0”和“1”賦與相加的兩個概率,讀出時由該符號開始一直走到最后的“1”, 將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號的霍夫曼編碼。 圖2.5霍夫曼編碼過程 例如2.5所示a7從左至右,由U至U″″,其碼字為0000;a6按踐線將所遇到的“0”和“1”按最低位到最高位的順序排好,其碼字為0001…用霍夫曼編碼所得的平均比特率為:Σ碼長出現(xiàn)概率;上例為:0.22+0.192+0.183+0.173+0.153+0.14+0.014=2.72 bit;可以算出本例的信源熵為2.61bit,二者已經是很接近了。 2.6 運動估計的運動補償編碼 這是一種幀間編碼的方法,其原理是利用幀間的空間相關性,減小空間冗余度。幀間編碼為什么可以減小冗余度,這是因為兩幀之間有很大的相似性。如果將前后兩幀相減 (移動物體作相應位移)得到的誤差作編碼所需比特要比幀內編碼所需的比特少,幀間差集中在零附近,可以用短的碼字傳送。實現(xiàn)幀間編碼的方法是運動估計和運動補償。用圖2.6來說明這個過程。 圖2.6運動處理過程 當前幀在過去幀的窗口中尋找匹配部分,從中找到運動矢量;根據運動矢量,將過去幀位移,求得對當前幀的估計;將這個估計和當前幀相減,求得估計的誤差值;將運動矢量和估計的誤差值送到接收端去。接收端根據收到的運動矢量將過去幀作位移(也就是對當前幀的估計),再加上接收到的誤差值,就是當前幀了。 圖2.7宏塊在上一幀搜索范圍內尋找匹配 圖2.8運動估計的全局搜索塊匹配 圖2.8運動估計的全局搜索塊匹配實際上,在做運動估計和運動補償時,是以1616的塊(稱宏塊)逐個進行的,如圖2.7所示,這是將當前幀劃分為NN(1616)的塊。對每一塊在過去幀中范圍為的范圍內進行搜索,以求得最優(yōu)匹配,從而得到運動矢量的估值(dx,dy)。衡量匹配好壞的準則可以是均方誤差最小準則。搜索方法可以是全局搜索法,即對搜索范圍內的每一點都計算均方誤差,選最小值即對應最優(yōu)匹配,如圖2.8所示。 3 MPEG-2編碼器原理 3.1 MPEG-2的編碼方式 MPEG-2有三種編碼方式:幀內壓縮編碼方式, 見圖3.1;幀間壓縮編碼方式,見圖3.2;幀內及幀間壓縮編碼方式, 見圖3.3。 圖3.1幀內壓縮編碼方式 壓縮就是將視頻信號中冗余減少的過程,首先必須識別每個視頻場和幀中的冗余,這主要包括空間與時間上的冗余。去除視頻信號空間冗余可通過DCT變換來完成,DCT變換是一個無信號損失的雙向數(shù)學過程。它將空間分布的變化程度轉變成重現(xiàn)空間分布所需的頻率帶寬。變換所得到的系數(shù)值既可以代表不斷增加的更高的垂直和水平空間頻率,也可以代表不同的水平和垂直空間頻率組合。視頻信號經過DCT變換后,較高的空間頻率系數(shù)會變得非常細小,而據人眼的視覺特性,較高的空間頻率系數(shù)可以少量的比特來表示,或者完全去掉而不影響圖像質量。在實際應用時為保持信號的可逆性和無損性,常常采用更多的比特來表示DCT系數(shù)。去除視頻信號時間冗余,可使用有運動補償?shù)膸g預測來完成。對于活動圖像多數(shù)情況下只是其中的很少一部分圖像在運動,即使有大范圍的活動部分,前后幀盡管有很大區(qū)別,但移動物體本身大多數(shù)情況下是相同的。因此只需要找到圖像中某一部分運動了多少就可以在前一幀找到相應圖像的內容,這個查找過程稱為運動估值,其表達方式是運動矢量;而把前一幀相應的運動部分補過來,得到其剩余的不同部分的過程稱為運動補償。就這樣,采用運動補償可以有效地去除視頻信號在時間方向的重復信息,達到壓縮的目的。 為了達到減少數(shù)據的目的,MPEG-2將4:2:2轉換成4:2:0,并且通過量化,將代表每一個系數(shù)的比特數(shù)目減少。一般使用11比特來代表DCT系數(shù),對于其他系數(shù)則采用較小的比特數(shù)目。每一個或每組宏塊都有不同的量化刻度,對每個宏塊采用不同的量化因數(shù),使只含幀內壓縮的MPEG能提供比同樣圖像質量的M-JPEG多出10%—20%的壓縮效果。而相對于原來的DCT系數(shù)的數(shù)據,量化表及被量化的系數(shù)數(shù)據量要小得多。 圖3.2幀間壓縮編碼方式 在量化過程后,無損數(shù)據壓縮是通過可變長度編碼VLC和游程長度編碼RLC實現(xiàn)的。VLC是在數(shù)據內尋找共同的圖案或字符,采用較小數(shù)量的比特為經常出現(xiàn)的數(shù)值進行編碼,而用較多數(shù)量的比特為較少出現(xiàn)的數(shù)值進行編碼。RLC是用一個字符代表一串一定數(shù)目的零??偟哪康闹挥幸粋€,減少數(shù)據量。 量化表控制是一個決定如何量化DCT系數(shù)的過程;輸出緩存可維持數(shù)據流,并提供量化器的控制,從而限制或維持數(shù)據流在一個一定的水平。在實實際應用中,當壓縮數(shù)據被錄像機記錄時,需要提供一個持續(xù)不變的比特率,以使機械部分以穩(wěn)定的速率旋轉掃描機構。而對于硬盤記錄來說,又需要一個可變速的比特率。通常,一個可變速比特率是提供一個持續(xù)不變質量水平的較好選擇。 圖3.3幀內及幀間壓縮編碼方式 幀間壓縮一般是在未壓縮的圖像上進行,是一個無損過程。在圖3.4中,在參考幀幀存中有一副完全解析度,完整數(shù)據的前一副圖像。在預測幀幀存中擁有一個根據前一幀和運動矢量所建立的預測的當前幀。輸出是預測的當前幀與實際當前幀相減后的差值。若沒有運動或其他變化,當前幀便可得到完美的預測,差分幀輸出為 0(極易壓縮)。當前一幀和后一幀有點不同時,差分幀仍有少量數(shù)據需要壓縮。采用幀內壓縮編碼形成的圖像稱為I幀,形成過程見圖3.3;采用幀內及幀間壓縮編碼形成的圖像稱為B幀和P幀。P 幀為前向預測幀,是以前一個I 幀為預測幀進行編碼的。在I 幀和P 幀中間可以插入若干個B 幀,B 幀是從相鄰的最近的I 幀或P 幀作雙向預測進行編碼的。形成P幀時參考幀幀存只要求存儲一幀圖象,而形成B幀時,參考幀幀存則需存儲前后兩幀圖象。由三種相互間有預測與生成關系的不同的幀數(shù)據,I 幀 P幀 B幀數(shù)據按照不同的組合組成圖像組(GOP),再加上序列起始碼和序列頭等數(shù)據組成圖像序列或ES,ES再打包成PES;PES再按188byte的固定長度加上各種參數(shù)組成傳送碼流TS。 3.2PAL解碼器 主要功能是對輸入的PAL復合信號進行解碼,輸出 YCbCr分量信號(4:2:2) 。PAL解碼器質量對整個處理系統(tǒng)的性能指標有非常重要的作用,并將影響最終的圖像質量,在設計時常采用8倍色度負載波對輸入的模擬信號進行采樣, 用數(shù)字梳狀濾波器完成亮色分離。同時為了避免視頻信源的抖動影響后面的壓縮處理部分,在PAL解碼器與前處理模塊之間有一幀的幀存進行信號隔離。 前處理模塊該模塊原理如圖3.4所示。主要功能:<1> 給PAL解碼器和I幀編碼器提供像素接口控制信號,其參數(shù)受CPU控制。<2> 對PAL解碼器輸出的視頻信號進行必要的限幅,使其滿足CCIR 601的要求(Y:16-235,C:16-240),并對Cb和Cr信號做扣心(Coring)處理。<3> 提供D1接口,可和數(shù)字視頻設備直接相連。<4> 在ES碼流的目標碼率較低時(如低于3Mbps),啟動1個16階的濾波器,對信號進行低通濾波,使其頻帶限制在3.5MHz左右,以降低解碼恢復的圖像中的塊效應。<5> 產生一個鋸齒波視頻測試信號,在CPU的控制下和輸入信號進行切換。另外,為了適應不同的碼組長度可使用截短的RS碼,例如DVB和GA。GA采用RS(207,187,10),即分組碼符號長度為207個,187個信號符號,可檢出207-187=20個錯,可糾正(207-187)2=10個錯。該碼就是從RS(255,235,10)碼截短而得到的,實際上可以看成255個符號中除207個有具體的值外,剩余的48個符號全部添零,可以用同樣的電路進行編解碼。 在DVCPRO、DVCAM、Digital-S格式中視、音頻數(shù)據的內碼組為RS(85.77)碼,檢錯能力為85-77=8byte,糾錯能力為(85-77)2=4byte。視頻數(shù)據的外碼組為RS(149.138),在內碼組指出錯誤位置時能糾錯149-138=11byte。音頻的外碼組為RS(14.9)碼,在內碼組指出錯誤位置時14byte中有不多于14-9=5byte的錯誤都能得到糾正。而Betacam SX的視頻內碼組為RS(124.112)外碼組為RS(64.50),聲音的內碼組為RS(124.112)外碼組為RS(14.6),其外碼組的糾錯能力明顯高于其它格式,加上磁跡寬度又比其它格式寬了許多,即使一個GOP中有兩根磁跡丟失,誤碼校正仍可正常進行,其誤碼校正數(shù)據塊的組成如圖3.2所示。 圖3.4前處理模塊該模塊 3.3 MPEG-2視頻編碼器 上文我們已從理論上對MPEG-2標準進行了系統(tǒng)的概述, 下面就以一個實例剖析一下MPEG-2視頻編碼器的物理實現(xiàn). 該編碼器可完成MPEG-2 MP@ML的壓縮,對CCIR 601 PAL制(720*576 像素/幀, 25幀/s)圖像進行實時恒定比特率傳輸模式(CBR)處理.整個編碼系統(tǒng)如圖3.5所示。 圖3.5視頻編碼硬件原理圖 4 MPEG-2解碼器原理 4.1 視頻基本碼流結構 如圖4.1視頻基本碼流結構所示: 圖4.1視頻基本碼流結構 a、在視頻序列層中,序列頭給了我們圖像的尺寸、寬高比、幀頻和比特率等數(shù)據,后面的序列擴展碼給出了型級、逐行隔行和色度格式(4:2:0、4:2:2)等信息。 b.在圖像組層中,GOP頭中給出了時間碼和緊跟在幀后的B圖像的預測特性等信息。 c.在圖層中,圖像頭中給出了時間參考信息、圖像編碼類型和VBV延時等信息。圖像頭后面的圖像擴展碼給出了運動圖像、圖像結構、量化因子類型和可變長編碼VLC等信息。 d.在像條層中,像條頭給出了像條垂直位置、量化因子碼等信息。 e.在宏塊層中,宏塊類型編碼給出了宏塊屬性、運動矢量等信息。 f.最后一層是像塊層,給出了像塊的DCT系數(shù)。 可見,視頻基本碼流中包含了供接收端正確解碼的信息。 4.2 MPEG-2解碼 MPEG-2解碼是從編碼的比特流中重建圖像幀。MPEG-2解碼方框圖如圖4.2所示 由圖4.2可見,接收到的碼流經過TS流解復用和視/音頻PES包解復用后輸出視頻基本流(ES)和運動矢量(MV)。ES經反量化(IQ)和反DCT(IDCT)后輸出重建的宏塊差值△MB。 解碼框圖中沒有復雜的運動估計電路,它直接用碼流中傳輸來的運動矢量(MV)進行運動補償,從幀存儲器中讀出匹配宏塊MB0,在加法器中與宏塊差值△MB相加,還原出相應的P、B圖像塊。 在幀重排內得到一組GOP解碼圖像后,重排成編碼時輸入顯示圖像的原始序列。由于解碼器中都有幀重排,結果使顯示圖像比原始圖像產生一定的延時, 圖4.2解碼器框圖 相對于聲音編解碼會導致畫面滯后于聲音,故需要相應的延時補償。 MPEG-2解碼與編碼電路不是一一對應的,編碼復雜,解碼簡單。因為,解碼所需要的許多參數(shù)和運動預測值和量化矩陣等都在傳輸碼流中以規(guī)定的句法元素格式提供給接收端,由解碼器直接使用就行了。 總 結 通過這次數(shù)字視頻信號源的編碼器和解碼器的研究的課程設計讓我學到了許多知識,不僅給我開闊了思路,而且還讓我認識到了自己對以前所學過知識的不足。 在這次課程設計當中我碰到了許多問題,我曾經接觸過這方面的書籍和實物,也對其有一些簡單的了解。但是卻不知道具體的工作原理,當我拿到課程設計的題名后完全不知道該怎么辦好,在指導老師董雪峰的悉心指導下,我明白了其中的道理,于此同時我通過大量地閱讀和查閱相關的資料,最終此次課程設計才得以完成。 通過這次課程設計讓我懂得了在以后的學習和工作當中要不斷地完善自我、努力上進、刻苦鉆研力爭在電子信息行業(yè)有一個好的發(fā)展和結果。 致 謝 課程設計是自己在大學中的一段經歷,從設計之初的無從下手到設計工作的圓滿完成,期間遇到了諸多的問題和困難。但在董老師的細心指導和幫助下,通過自己的努力,最終這些問題與困難都得到了圓滿解決。使我可以按時課程設計并使自己的專業(yè)知識與綜合能力都得到了相應的提高。在課程設計過程中,董老師在百忙中對我的設計進行了指導。他首先細致地為我解題;當我迷茫于眾多的資料時,又為我提綱挈領、梳理脈絡,使我確立了本文的框架。感謝董老師對我的課程設計不厭其煩的悉心指導。在課程設計寫作當中中,每次都能恰逢其時地得到董老師的親切指點。從框架的完善,到內容的擴充;從行文的用語到格式的規(guī)范;董老師都嚴格要求,力求完美。而且我還從董老師那里學到了嚴謹、務實、認真的工作態(tài)度和極強的敬業(yè)精神。我再次為董老師的耐心付出表示感謝。 參考文獻 1. 蔣秀華.現(xiàn)代電視機原理[M]. 北京高等教育出版社,2008. 2. 李海霞.電視機原理實驗指導書[M]. 鄭州黃河科技學院,2008. 3. 裴昌辛.電視原理與現(xiàn)代電視系統(tǒng)[M]. 西安.西安電子科技大學出版,1997. 4. 趙堅勇.電視原理與接收技術[M]. 北京:國防工業(yè)出版社,2007. 5. 劉達.數(shù)字電視技術[M]. 北京:電子工業(yè)出版社,2007. 6. 解玉琢.MPEG-2運動圖像編碼國家標準及MPEG的新進展[M]. 北京:清華大學出版社,2002.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 數(shù)字視頻 信號源 編碼器 解碼器 研究
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.hcyjhs8.com/p-10127713.html