多媒體技術第三課ppt課件
《多媒體技術第三課ppt課件》由會員分享,可在線閱讀,更多相關《多媒體技術第三課ppt課件(20頁珍藏版)》請在裝配圖網(wǎng)上搜索。
3.7 靜態(tài)圖像壓縮標準JPEG,JPEG —Joint Photographic Experts Group 壓縮方法: 1.基于DPCM的無失真編碼 低壓縮比 2.基于DCT的有失真壓縮 (順序方式) 3.基于DCT的累進操作方式 4.基于DCT的分層操作方式,1,,一、基于DPCM的無失真編碼,壓縮比2:1,2,,二、基于DCT的有失真壓縮(順序方式),DCT,量化器,量化表,,,,圖像按順序分成8×8子塊,并將取值范圍[0,2P-1]變換為[- 2P-1, 2P-1-1](有符號數(shù)),進行DCT變換。 P:樣本定義的精度。 對基于DCT的編碼,p取8或12 對基于DPCM的編碼,p取2~16。,3,,三、基于DCT的累進操作方式 對DCT系數(shù)進行多次掃描,分批編碼。圖像通過累進由粗 至細。 ●頻譜選擇法:按頻帶分批編碼。 一次掃描,只對64個DCT系數(shù)中某些頻帶的系數(shù)進行編碼,傳遞,在隨后的掃描中,對其他頻帶的系數(shù)編碼、傳遞,直到全部系數(shù)處理完畢為止。 ●按位逼近法:按位分段編碼。 沿著DCT量化系數(shù)有效位方向分段累進編碼。第一次掃描只取最高有效位的n位編碼、傳遞,然后對其余位進行編碼、傳遞。,4,四、基于DCT的分層操作方式 (1)將原圖像分辨率降低; (2)按對降低分辨率的圖像進行編碼; (3)對低分辨率的編碼圖像解碼插值重建,升高分辨率; (4)將分辨率升高的圖像作為原圖像的預測值,取其差值進行編碼; (5)重復(3)(4),直到達到完整的分辨率。 適于用低分辨率設備處理高分辨率圖像。,5,JPEG-2000主要特點,單分量(如灰度)和多分量(如彩色)數(shù)據(jù)的有失真或無失真壓縮; 特定區(qū)域編碼; 按照逼真度或分辨率的分層圖像恢復; 圖像中特定區(qū)域的隨機訪問; 優(yōu)異的壓縮性能,特別是在高壓縮比時; 良好的誤差恢復特性。 與JPEG相比,有更大的靈活性。特別是對原始數(shù) 據(jù)和壓縮比特流的組織,實現(xiàn)直接從壓縮比特流 中提取并恢復低分辨率或高分辨率圖像,不必對 全部比特流解碼。,6,3.8運動圖像壓縮標準MPEG,MPEG-Moving Picture Experts Group 運動圖像:靜態(tài)圖像的序列。 一、MPEG1視頻數(shù)據(jù)流的結構,,,圖像,切片,宏塊,Y,,亮度像素,色度像素,,,,,,7,圖像序列層:由序列頭、一個或多個圖像組和序列結束碼組成。 圖像組層:由頭信息、一幀或連續(xù)若干圖像組成的可以隨機訪問的一段以及結束碼組成。 圖像層:包含頭信息和一幀圖像所有的編碼數(shù)據(jù)。 切片層:由一個或多個相鄰的宏塊組成。 宏塊層:由四個亮度塊和兩個色度塊構成。 塊層:MPEG-1中最小的編碼單位。包括DCT系數(shù)和塊結束標志。,8,,二、MPEG-1視頻編碼方法 MPEG-1:圖像及伴音的壓縮傳輸速率:1.5Mbps 亮度分辨率:亮度360×240,色度180 ×120 1.幀的類型 I(intra picture)幀:圖像數(shù)據(jù)流的隨機存取點,幀內(nèi)空間壓縮,基于DCT的編碼,1-2比特/像素。 P(predicted picture)幀:由前一個I幀或P幀預測得到的幀。 B(bidirectional picture)幀:前后作參照進行預測,雙向預測幀,圖像組幀結構,9,,2.運動序列流 I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B 顯示順序不同于編解碼順序。在B幀之前必須先恢復參照幀。 解碼順序為: I P B B P B B P幀和B幀采用運動補償。,運動補償預測是一種降低時間冗余度的有效方法。 該技術假設每一幀圖像都是以過去某一幀圖像為原型并經(jīng)過變換得到的。這種變換是局部的,即圖像上各點的位移方向和大小不必相同。要求運動向量值必須正確編碼。 改善了隨機訪問性能,提高了運動視頻圖像的質量。,10,P幀的編碼:P幀允許以前一個I幀或P幀為參考進行運動補償預測。 B幀的編碼:一種雙向預測或插值編碼,可以看作一種時間上的多分辨率技術。先對I幀和P幀進行編碼,然后通過從重建的I幀和P幀插值得到其余的幀,并對插值誤差進行DCT變換編碼。,11,MPEG-1視頻編碼器框圖,圖像序列,MPEG流,12,三、MPEG的發(fā)展,MPEG-1(ISO/IEC 11172) 輸出速率:1.5Mbps 標準交換格式(SIF)的圖像: 亮度360×240/ 360×288,色度180 ×120/ 180×144 源輸入格式的電視: NTSC 352像素×240行/幀×30幀 PAL 352像素×288行/幀×25幀 ISO/IEC 11172-1規(guī)定圖像、聲音及其他相關數(shù)據(jù)的同步 ISO/IEC 11172-2規(guī)定視頻圖像的編碼和解碼 ISO/IEC 11172-3規(guī)定聲音的編碼和解碼 ISO/IEC 11172-4測試 ISO/IEC 11172-5軟件模擬,13,,2. MPEG-2(ISO/IEC 13818) 高質量圖像和聲音編碼標準,圖像基本編碼算法與MPEG-1 相同。 標準分成10個組成部分,規(guī)定了 數(shù)據(jù)的同步 數(shù)據(jù)流的組合 圖像數(shù)據(jù)的編碼解碼 聲音數(shù)據(jù)的編碼解碼(MPEG-1聲音的擴充) 一致性測試、 軟件模擬 軟件管理 數(shù)據(jù)流的存儲媒體命令和控制擴展協(xié)議、 多聲道聲音的編碼算法標準(先進聲音編碼)、 解碼器實時接口擴展標準(適應網(wǎng)絡傳輸?shù)臄?shù)據(jù)流)等。,14,MPEG-2主要特點,允許隔行掃描和逐行掃描輸入,高清晰度輸入,以及三種不同的色度亞取樣方案(4:2:0、4:2:2、4:4:4); 空間和時間上的分辨率可調(diào)整編碼; 適應隔行掃描的預測方法和塊掃描方式。,MPEG-2的電視圖像配置見下表:,15,,16,,3. MPEG-4 (ISO/IEC 14496) 目的:建立可應用于移動通信和PSTN低速率多媒體通信 標準,支持可視電話、電子郵件等。 特點:提供基于內(nèi)容的交互、高效壓縮和通用訪問性。 原理: 視頻場景為視頻對象的組合。視頻對象具有形狀、 運動和紋理等屬性。 因而在運動補償、DCT和變長編碼的基礎上采用形狀編碼,編碼器的輸入不是視頻幀,而是視頻對象平面(VOP)。,17,視頻碼流的語法分成五個層次: 視頻會話(VS):視頻序列由若干VS組成。 視頻對象(VO) : VS由若干VO組成。 視頻對象層 (VOL): VOL對應一個VO的不同空間和時間分辨率, 一個VO可有若干個VOL。 視頻對象平面組(GOV):可選層,提供隨機訪問、重同步和數(shù)據(jù)恢復能力,由若干VOP 組成。 視頻對象平面(VOP):為VO或VOL特定時刻的瞬像,分為I、P、B和S四種。 S- VOP為全景圖編碼。,18,MPEG-4算法方框圖,,19,,4. MPEG-7多媒體內(nèi)容描述接口 目的:用于多媒體信息的管理和檢索。 建立與內(nèi)容相聯(lián)系的標準化的描述。,20,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 多媒體技術 第三 ppt 課件
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.hcyjhs8.com/p-1328729.html