四兩撥千斤 Haswell核芯顯卡轉(zhuǎn)碼測(cè)試
泡泡網(wǎng)CPU頻道7月9日 雖然近年來(lái)隨著芯片工藝的發(fā)展,智能手機(jī)和平板電腦的性能得到了快速的增長(zhǎng),一些手機(jī)甚至可以流暢播放1080p視頻,不過(guò)受限于容量、屏幕分辨率等因素,高清1080p視頻并不適合在智能手機(jī)或平板電腦商播放,另外針對(duì)目前參差不齊的移動(dòng)播放器市場(chǎng),兼容問(wèn)題也很讓人頭疼,卡死、閃退問(wèn)題相信經(jīng)常用移動(dòng)設(shè)備看視頻的用戶(hù)經(jīng)常會(huì)遇到。
為了解決這些問(wèn)題,將大容量視頻轉(zhuǎn)碼為小容量、小碼率則可以很好的解決這些問(wèn)題,早期轉(zhuǎn)碼一部視頻可能需要幾十分鐘甚至幾個(gè)小時(shí),甚至超過(guò)了觀看視頻的時(shí)間,得不償失。于是硬件加速被應(yīng)用于視頻播放后,再次成為視頻轉(zhuǎn)碼的利器,目前無(wú)論是Intel、AMD還是NVIDIA都提供了高清視頻的硬件加速功能,甚至是4K視頻也不在話(huà)下。
在2011年初,Intel發(fā)布了全新一代Sandy Bridge處理器,正式引入了高速視頻同步技術(shù)(Quick Sync Video),借助專(zhuān)屬設(shè)計(jì)的MFX(Multi-Format Codec)并行引擎,全面為視頻轉(zhuǎn)碼提速,大大減少了轉(zhuǎn)碼的等待時(shí)間,如今第四代智能酷睿處理器Haswell也已經(jīng)到來(lái),產(chǎn)品進(jìn)一步優(yōu)化視頻轉(zhuǎn)碼性能,另外在畫(huà)質(zhì)上也得到進(jìn)一步加強(qiáng)。
Haswell核芯顯卡采用了全新的“Iris”品牌,中文名為“銳炬”,產(chǎn)品根據(jù)性能定位分為GT1、GT2、GT3、GT3e,只有最高的GT3、GT3e才使用了帶Pro的后綴。
相對(duì)于上一代HD Graphics 4000/2500,新的核心顯卡完整支持DX11.1、OpenGL 3.2、OpenCL 1.2,并且支持新一代4K分辨率和三屏顯示輸出。
規(guī)格方面,GT3和GT3e都擁有40個(gè)EU單元,其中GT3e還配備了獨(dú)立的eDRAM,而GT3僅搭載在桌面“R”后綴的處理器和移動(dòng)“HQ”后綴的處理器上。主流級(jí)別的GT2為20個(gè)EU單元,最低的GT1目前尚未有搭載的新品發(fā)布。
從Sandy Bridge起,Intel核芯顯卡就開(kāi)始支持高速視頻同步技術(shù),運(yùn)用專(zhuān)屬的多媒體處理單元,使影片的制作和轉(zhuǎn)碼更快、更輕松。運(yùn)用此技術(shù),您就可以快速建立DVD或藍(lán)光光盤(pán)、制作與編輯3D影片、將2D影片檔轉(zhuǎn)換為3D、轉(zhuǎn)換影片以便在移動(dòng)媒體播放器上播放,以及上傳到您最喜愛(ài)的社交網(wǎng)站。
發(fā)展到Haswell的第三代高速視頻同步技術(shù)技術(shù),最多可是實(shí)現(xiàn)16倍的視頻轉(zhuǎn)碼提速,將等待時(shí)間大幅縮短。
用于第四代智能英特爾酷睿處理器的英特爾高速視頻同步技術(shù)包括以下新型H.264編碼特性:
1. 每兆字節(jié)比特率控制
2. Trellis量子化
3. 多層級(jí)運(yùn)動(dòng)估算
4. 多參考
5. 多預(yù)測(cè)器
6. B型金字塔
7. Lookahead
Haswell核心顯卡這些設(shè)計(jì)先對(duì)于此前的產(chǎn)品進(jìn)行了多處重要改進(jìn),采用了多種新特性與功能,以改進(jìn)性能、減少能耗、提高圖像質(zhì)量。
● 主要改進(jìn)包括:
- 在多格式編解碼引擎中增加JPEG/MJPEG解碼。研發(fā)者在現(xiàn)有的高能效、高性能AVC編碼/解碼(支持多個(gè)4K及超清視頻流)的基礎(chǔ)上增加了這種支持。
- 增加專(zhuān)用新型視頻質(zhì)量引擎,以期在低能耗條件下完成大批量視頻處理。
- 經(jīng)過(guò)媒體優(yōu)化的可編程EU(執(zhí)行單元)/取樣器,實(shí)現(xiàn)優(yōu)質(zhì)視頻
- 全新設(shè)計(jì)的媒體取樣器,其執(zhí)行速度快于前幾代產(chǎn)品
- 可升級(jí)架構(gòu),擁有出色靈活性,可提供基于應(yīng)用要求的加速技術(shù)
轉(zhuǎn)碼性能測(cè)試中我們選取了一段越40分鐘的1280x720分辨率視頻,而轉(zhuǎn)碼后的目標(biāo)視頻為720x480分辨率,編碼格式為H.264。
CPU/GPU加速轉(zhuǎn)碼時(shí)間對(duì)比
測(cè)試成績(jī)方面綠色部分為GPU加速后的成績(jī),其中GeForce GTX 760加速測(cè)試平臺(tái)處理器為Core i7 4770K,其余加速分別為對(duì)應(yīng)的核芯顯卡加速。
CPU/GPU加速轉(zhuǎn)碼提速倍率
為更直觀的對(duì)比各自的轉(zhuǎn)碼性能,上圖還列出了提速倍率,可以看出Core i7 4770K配合HD Graphics 4600核芯顯卡加速可以獲得15.5x的加速,名列第一。緊隨其后的是Core i7 3770K搭配HD Graphics 4000。值得注意的是Core i7 4770K搭配GeForce GTX 760的提速是14.7x。
我們知道視頻轉(zhuǎn)碼主要有軟解和硬解兩種方式,軟件編碼器能夠通過(guò)CPU實(shí)施極為復(fù)雜的動(dòng)態(tài)估算和詳盡的率失真優(yōu)化,以獲得非常好的質(zhì)量。但其缺點(diǎn)在于計(jì)算成本非常之高。另一方面,硬件編碼器通常被認(rèn)為靈活性不佳,一般認(rèn)為硬件編碼器不能達(dá)到必要的編碼質(zhì)量。這正是許多硬件編碼器被認(rèn)為只能用于簡(jiǎn)單的視頻制作和視頻瀏覽的原因所在。
CPU/GPU加速轉(zhuǎn)碼視頻截圖對(duì)比
從上圖可以看出CPU軟解相對(duì)于顯卡硬解有著得天獨(dú)厚的優(yōu)勢(shì),全面優(yōu)于采用GPU加速的轉(zhuǎn)碼視頻。由于采用了相同的架構(gòu)Core i5 3570K iGPU加速和Core i7 3770K iGPU加速擁有相同的視頻轉(zhuǎn)碼質(zhì)量,而Core i5 4670K iGPU加速和Core i7 4770K iGPU加速也是相同的。
而GPU加速的轉(zhuǎn)碼視頻里面,雖然Core i7 4770K iGPU加速擁有最快的速度,不過(guò)視頻轉(zhuǎn)碼質(zhì)量相比Core i7 3770K iGPU加速還出現(xiàn)了倒退,這樣Core i7 3770K iGPU就獲得了最優(yōu)質(zhì)量GPU加速轉(zhuǎn)碼。
最后的轉(zhuǎn)碼質(zhì)量也可以清楚的看出Core i5 3570K iGPU加速和Core i7 3770K iGPU加速以及Core i5 4670K iGPU加速和Core i7 4770K iGPU加速是相同的,值得注意的是GeForece GTX 760加速轉(zhuǎn)碼后容量雖然最大,甚至高出了CPU軟解碼的視頻輸出,但是視頻質(zhì)量卻相對(duì)一般。
● 總結(jié):新一代Haswell借助增強(qiáng)的CPU性能和改善的iGPU架構(gòu),獲得了最快的轉(zhuǎn)碼速率,甚至超越了中高端顯卡加速,高達(dá)15.5x的時(shí)間加速可以大幅減少用戶(hù)的等待時(shí)間,提高工作效率。
不過(guò)在視頻輸出質(zhì)量上,Haswell iGPU加速卻表現(xiàn)一般,甚至不如上代Ivy Bridge iGPU,當(dāng)然也有可能是MediaCoder還不能完美支持Haswell iGPU加速轉(zhuǎn)碼?!?
關(guān)注我們
