基于DSP和FPGA的視頻編碼器硬件平臺2

2013-08-27 15:01 來源:電子信息網(wǎng) 作者:和靜

2 視頻壓縮算法優(yōu)化

(1)MPEG-4數(shù)據(jù)流優(yōu)化設計

實驗表明,如果代碼和代碼要訪問的數(shù)據(jù)在C6201片內(nèi)存儲區(qū)(PRAM和DRAM),其代碼執(zhí)行速度要比代碼和數(shù)據(jù)在片外同步SDRAM中平均快17倍(片內(nèi)總線寬度為256位,數(shù)據(jù)訪問為1個CPU周期)。因此,將執(zhí)行代碼和數(shù)據(jù)放到片內(nèi)將大大提高程序的運行速度。

在MPEG-4算法中,由于沒有考慮存儲器的限制,算法每次讀入一幀YUV數(shù)據(jù)進行壓縮編碼。但對于C6201來說,片內(nèi)只有64K字節(jié)DRAM,不可能一次將一幀數(shù)據(jù)讀到片內(nèi)存儲器進行壓縮。如果將一幀數(shù)據(jù)一次讀到片外存儲器(SDRAM)中進行壓縮,又會大大降低代碼的執(zhí)行速度,因此,我們對視頻壓縮算法進行了改進,一次對一個切片(slice)數(shù)據(jù)進行壓縮編碼,并將壓縮碼流數(shù)據(jù)直接送入到發(fā)送緩沖區(qū)中。

編碼器一次將一個切片的YUV數(shù)據(jù)(當前幀)讀入到片內(nèi)存儲器中,然后根據(jù)計算決定切片宏塊的編碼類型(幀內(nèi)/幀間編碼)。如果宏塊進行幀內(nèi)編碼,則YUV數(shù)據(jù)被分成8×8的像素塊(一個宏塊包含4個Y分量像素塊和2個UV分量像素塊)進行DCT變化,以消除圖像空間冗余信息。DCT變化后的系數(shù)經(jīng)過量化后進行游程編碼(RunLengthCoding即RLC)和變長編碼(VariableLengthCoding,即VLC),變長編碼的結(jié)果送入到視頻發(fā)送緩沖區(qū)中。與此同時,量化后的DCT系數(shù)經(jīng)過反量化(結(jié)果放入內(nèi)存B中)和反DCT過程形成重建幀,重建幀用作下一幀的參考幀。

如果宏塊進行幀間編碼,則以宏塊為單位進行運動估計,根據(jù)運動估計的結(jié)果建立預測幀。當前幀和預測幀的差值形成了殘差幀(residue frame),殘差幀的編碼過程與幀內(nèi)編碼過程相同。

(2)宏塊編碼類型判別算法

在MPEG-4算法中采用了快速運動估計算法,但是在進行宏塊編碼類型判別時計算量仍然很大。為此,本文提出了基于宏塊空間復雜度的判別算法MTJBSC,進一步降低了運動估計過程中的計算量。

在編碼P幀宏塊的時候,首先要決定宏塊是進行幀內(nèi)編碼還是幀間編碼。在標準MPEG-4算法中是通過以下方法決定的[5]:

設參考宏塊的像素值(Y分量值,以下同)用P(x,y)表示,當前宏塊的像素值用C(x,y)表示,x,y表示宏塊的縱、橫坐標,M,N表示宏塊的寬和高。當前宏塊像素值的方差用EVAR表示,其值為

3

參考宏塊和當前宏塊的方差用EVMC表示,其值為

4

EVMC值越小(比如EVMC

if(EVMC>EVARandEVMC≥9)then幀內(nèi)編碼else幀間編碼

顯然,在MPEG-4算法中,為了判斷宏塊的編碼模式進行了大量的計算(對于每一個P幀宏塊都要進行上面的計算)。為了減少計算復雜度,本文提出了基于宏塊空間復雜度(EMBC)的宏塊類型判斷(MTJBSC)算法,用以判斷P幀宏塊的幀內(nèi)/幀間編碼模式。

基于DSP和FPGA設計的視頻編碼器硬件平臺(一)

1 2 > 
DSP FPGA

相關閱讀

暫無數(shù)據(jù)

一周熱門