Nghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDA

85 859 0
Nghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công  nghệ CUDA

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDANghiên cứu tăng tốc độ tìm kiếm Vector chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDA

HC VIN CễNG NGH BU CHNH VIN THễNG - NGUYN THANH TUN NGHIấN CU TNG TC TèM KIM VECTOR CHUYN NG TRONG NẫN VIDEO S DNG KIN TRC SONG SONG GPU NVIDIA V CễNG NGH CUDA Chuyờn ngnh: H THNG THễNG TIN Mó s: 60.48.01.04 LUN VN THC S K THUT NGI HNG DN KHOA HC: PGS.TS TRN VN HOI THNH PH H CH MINH NM 2016 LI CAM OAN Tụi xin cam oan lun Thc s: Nghiờn cu tng tc tỡm kim vộc t chuyn ng nộn video s dng kin trỳc song song GPU NVIDIA v cụng ngh CUDA l cụng trớnh nghiờn cu ca riờng tụi Cỏc s liu, kt qu c trớnh by lun l trung thc, cha tng c cụng b bt k cụng trớnh no khỏc Tp.H Chớ Minh, ngy 23 thỏng 06 nm 2016 HC VIấN THC HIN LUN VN NGUYN THANH TUN LI CM N Tụi xin c bit cm n PGS.TS Trn Vn Hoi, ngi ó trc tip ch bo, dnh nhiu thi gian, tõm huyt, gúp ý v ng viờn tụi tụi hon thnh c tt nghip ny Xin gi li cm n chõn thnh ti cỏc thy, cụ cu Hc vin Cụng ngh bu chỡnh vin thụng to iu kin thun li, nhit tớnh giỳp tụi sut quỏ trớnh nghiờn cu Trong quỏ trớnh nghiờn cu ti ny, mc dự ó cú nhiu c gng nhng lun khụng th trỏnh nhng thiu sút, tụi rt mong nhn c s gúp ý chõn thnh ca quý thy, cụ Tụi xin chõn thnh cm n! Tp.H Chớ Minh, ng y 23 thỏng 06 n m 2016 HC VIấN THC HIN LUN VN NGUYN THANH TUN MC LC LI CAM OAN i LI CM N ii MC LC iii DANH MC CC THUT NG, CH VIT TT vi DANH SCH HèNH V viii DANH SCH BNG x M U .1 CHNG TNG QUAN V B CHUYN NG V CC THUT TON TèM VẫC T CHUYN NG TRONG NẫN VIDEO 1.1 Tng quan v bự chuyn ng MPEG 14 1.1.1 Khỏi nim v nộn Video 14 1.1.2 Gii thiu chung v chun MPEG .6 1.1.3 Phng phỏp nộn video theo chun MPEG .7 1.1.3.1 Cỏc cu trỳc nh 1.1.3.2 Nhúm nh (GOP) 1.1.3.3 Cu trỳc dũng bit MPEG 10 1.1.4 Phng phỏp nộn video theo chun MPEG .12 1.1.4.1 Mụ hớnh tng quỏt b mó húa video theo chun MPEG 12 1.1.4.2 Ly thụng tin theo mu .13 1.1.4.3 Lng t húa .16 1.1.4.4 Ni suy nh .17 1.1.4.5 D oỏn bự chuyn ng 17 1.2 Cỏc thut toỏn tớm vộc t chuyn ng 23 1.2.1 Thut toỏn tớm kim ba bc 23 1.2.2 Thut toỏn tớm kim 2D-logarit 24 1.2.3 Thut toỏn tớm kim trc giao 34 1.2.4 Thut toỏn tớm kim CROSS 26 1.2.5 Thut toỏn tớm kim ba bc mi 27 1.2.6 Thut toỏn tớm kim bn bc 28 1.2.7 Thut toỏn tớm kim da trờn gradient descent 39 1.2.8 Thut toỏn tớm kim Diamond 31 CHNG TNG QUAN V CU TRC H THNG X Lí HA GPU V CễNG NGH TNH TON SONG SONG D LIU CUDA 33 2.1 Gii thiu i cng v tỡnh toỏn song song 33 2.1.1 Tng quan v tỡnh toỏn song song 33 2.1.1.1 Ti phi tỡnh toỏn song song .33 2.1.1.2 Mt s khỏi nim v x lý song song .33 2.1.2 Phõn loi cỏc kin trỳc song song 34 2.1.2.1 Kin trỳc n dũng lnh, n lung d liu (SISD) 35 2.1.2.2 Kin trỳc n dũng lnh, a lung d liu (SIMD) 35 2.1.2.3 Kin trỳc a dũng lnh, n lung d liu (MISD) 36 2.1.2.4 Kin trỳc a dũng lnh, a lung d liu (MIMD) 37 2.1.3 Cỏc mụ hớnh lp trớnh song song 37 2.1.3.1 Lp trớnh b nh dựng chung 37 2.1.3.2 Lp trớnh truyn thụng ip .38 2.1.3.3 Mụ hớnh song song d liu 38 2.1.3.4 Mụ hớnh hng i tng 39 2.1.3.5 Mụ hỡnh logic 39 2.1.4 ỏnh giỏ hiu qu tỡnh toỏn song song 39 2.2 Cu trỳc h thng x lý d liu GPU 43 2.2.1 Gii thiu v cụng ngh GPU 43 2.2.2 Tớm hiu kin trỳc GPU 43 2.2.2.1 ng ng dn 44 2.2.2.2 Tin húa ca kin trỳc GPU 45 2.2.2.3 Kin trỳc GPU hin ti 46 2.2.3 So sỏnh GPU v CPU .48 2.2.4 ng dng ca GPU cỏc lnh vc 49 2.3 Cụng ngh tỡnh toỏn song song h tr d liu CUDA 50 2.3.1 Gii thiu v cụng ngh CUDA .50 2.3.2 Cu trỳc ca CUDA 52 2.3.3 ng dng ca CUDA cỏc lnh vc cụng ngh .54 2.3.3.1 CUDA ngnh cụng nghip trũ chi 54 2.3.3.2 CUDA cỏc ng dng video s 54 2.3.4 Mụi trng lp trớnh vi CUDA 55 2.3.5 Lp trớnh song song vi CUDA .56 2.3.5.1 CUDA l m rng ca ngụn ng lp trớnh C 56 2.3.5.2 Nhng m rng ca CUDA so vi ngụn ng lp trớnh C 57 2.3.5.3 T khúa vi phm kiu hm .57 2.3.5.4 T khúa vi phm kiu bin .57 2.3.5.5 Cu hớnh thc thi .58 2.3.5.6 Cỏc bin built-in 59 2.3.5.7 Biờn dch vi NVCC 59 CHNG Mễ T CHNG TRèNH V CC KT QU THC NGHIM T C 3.1 Mụ t chng trớnh 68 3.1.1 Song song húa cỏc thut toỏn tớm kim vộc t chuyn ng trờn CUDA 68 3.1.2 Xõy dng chng trớnh thc nghim .63 3.2 Kt qu thc nghim t c 67 3.3 ỏnh giỏ kt qu thc nghim t c 72 KT LUN V KIN NGH 82 TI LIU THAM KHO 77 DANH MC CC THUT NG, CH VIT TT Vit tt Ting Anh Ting Vit BMA Block Matching Algorithm Thut toỏn so khp ni BDM Block Distortion Measure o bin dng BMME Block Matching Motion c lng chuyn ng phi hp Estimation CUDA Compute Unified Device Kin trỳc thit b hp nht cho tỡnh toỏn Architecture DCT Discrete Cosine Transform Bin i cosin ri rc DFT Discrete Fourier Transform Bin i fourier ri rc DS Diamond Search Thut toỏn tớm kim kim cng DMS Discrete Memory less Source Ngun khụng nh ri rc DPCM Differential Pulse Code iu ch xung mó vi sai Modulation FS Full Search Thut toỏn tớm kim y (Vột cn) FT Fourier Transform Bin i Fourier FFT Fast Fourier Transform Bin i Fourier nhanh GPU Graphics Processing Unit B x lý GPGPU General Purpose computing on B x lý x lý cỏc cụng vic graphics processing units ca CPU 4SS Four Step Search Thut toỏn tớm kim bc IDCT Inverse Discrete Cosine Bin i ngc DCT Transform HVS Human Visual System H thng nhớn ca ngi LMS Least Mean Square Bớnh phng trung bớnh ti thiu LDSP Large Diamond Search Pattern Thut toỏn tớm kim kim cng ln MAD Mean Absolute Deviation lch tr tuyt i trung bớnh MSE Mean Squared Error Sai s trung bớnh bớnh phng MPEG Moving Picture Experts Group Nhúm cỏc chuyờn gia hớnh nh ng NTSS New Three Step Search Thut toỏn tớm kim ba bc mi NCCF Normalized Cross Correlation Hm tng quan chộo chun húa Function PSNR Peak Signal to Noise Rate T s tỡn hiu nh trờn nhiu TSS Three Step Search Thut toỏn tớm kim ba bc SAD Sum of Absolute Differences Tng cỏc sai phõn tuyt i SDSP Small Diamons Search Pattern Thut toỏn tớm kim kim cng nh SSD Sum Squared Difference Tng cỏc sai phõn bớnh phng VLC Variable Length Coding Mó húa vi di t mó thay i DANH SCH HèNH V Hớnh 1.1 S h thng nộn nh tiờu biu Hớnh 1.2 H thng cỏc chun MPEG Hớnh 1.3 Cu trỳc GOP m Hỡnh 1.4 Cu trỳc GOP úng Hớnh 1.5 Kin trỳc dũng d liu MPEG 11 Hớnh 1.6 B mó húa MPEG tiờu biu 12 Hớnh 1.7 Cu trỳc ly mu theo chun 4:4:4 14 Hớnh 1.8 Cu trỳc ly mu theo chun 4:2:2 15 Hớnh 1.9 Cu trỳc ly mu theo chun 4:2:0 15 Hớnh 1.10 Cu trỳc ly mu theo chun 4:1:1 16 Hớnh 1.11 c lng chuyn ng so sỏnh 20 Hớnh 1.12 Chia ca s tớm kim di dng li theo BMA 21 Hớnh 1.13 Minh quỏ trớnh bự chuyn ng theo gii thut BMA 22 Hớnh 1.14 Mụ hớnh tớm kim theo thut toỏn TSS 24 Hớnh 1.15 Hai ng tớm kim ca thut toỏn tớm kim 2DLOG 25 Hớnh 1.16 Hai ng tớm kim ca thut toỏn tớm kim trc giao 26 Hớnh 1.17 Hai ng kim tra theo thut toỏn tớm kim CROSS 27 Hớnh 1.18 Hai ng tớm kim ca thut toỏn tớm kim ba bc mi 28 Hớnh 1.19 Hai ng tớm kim chuyn ng ln theo thut toỏn FSS 29 Hớnh 1.20 Hai ng tớm kim chuyn ng nh ca thut toỏn FSS 29 Hớnh 1.21 Mụ hớnh tớm kim ca thut toỏn BBGDS 31 Hớnh 1.22 Mụ hớnh tớm kim theo thut toỏn tớm kim Diamond 32 Hớnh 2.1 Mụ hớnh kin trỳc mỏy SISD 35 Hớnh 2.2 Mụ hớnh kin trỳc mỏy SIMD 36 Hớnh 2.3 Mụ hớnh kin trỳc mỏy MISD 36 Hớnh 2.4 Mụ hớnh kin trỳc mỏy MIMD 37 Hớnh 2.5 Mụ t lp trớnh gia cỏc tỏc v dựng chung b nh 37 Hớnh 2.6 Mụ hớnh lp trớnh truyn thụng gia hai tỏc v trờn hai mỏy tớnh 38 Hớnh 2.7 Mụ hớnh lp trớnh song song d liu 38 Hớnh 2.8 K thut xen k tỡnh toỏn v truyn thụng gia P1 v P2 40 Hỡnh 2.9 So sỏnh kin trỳc CPU v GPU 48 Hỡnh 2.10 So sỏnh Gflops gia GPU v CPU 49 Hỡnh 2.11 Kin trỳc b phn mm NVidia CUDA 51 Hỡnh 2.12 Cỏc thao tỏc thu hi v cp phỏt b nh vi CUDA 51 Hỡnh 2.13 Vựng nh dựng chung mang d liu gn ALU hn 52 Hớnh 2.14 Phõn cp lung CUDA 53 Hớnh 2.15 S hot ng truyn d liu gia Host v Device 56 Hớnh 3.1 Tuyn tỡnh húa lung theo ch s x 62 Hớnh 3.2 Hai khung nh u vo c tỏch t video Foreman 64 Hớnh 3.3 Hai khung nh u vo c chuyn sang nh dng PGM 64 Hớnh 3.4 Kt qu chy chng trớnh vi khung nh 65 Hớnh 3.5 nh cha cỏc vộc t chuyn ng 65 Hớnh 3.6 nh bự chuyn ng 66 Hớnh 3.7 nh so sỏnh d tha vi nh gc sau bự chuyn ng 66 Hớnh 3.8 Kt qu chy chng trớnh vi 200 frame nh u vo 67 Hớnh 3.9 Giao din phn mm FFmpeg 68 Hớnh 3.10 Cỏc khung nh tun t c xem bng phn mm MegaView 69 Hớnh 3.11 Mt khung nh c trỡch b test football 69 Hớnh 3.12 Vộc t chuyn ng ca khung nh hớnh 3.10 70 Hớnh 3.13 Biu so sỏnh hiu nng gia cỏc thut toỏn trờn GPU v CPU 72 Hớnh 3.14 Biu so sỏnh cht lng nộn video theo h s PSNR 72 Hỡnh 3.2: Hai khung nh u vo c tỏch t videoForeman nh u vo s c bin i thnh nh dng PGM tỡnh toỏn chng trớnh Hỡnh 3.3: Hai khung nh u vo c chuyn sang nh dng PGM Hỡnh 3.4: Kt qu chy chng trỡnh vi hai khung nh Hỡnh 3.5: nh cha cỏc vộc t chuyn ng Hỡnh 3.6: nh bự chuyn ng Hỡnh 3.7: nh so sỏnh d tha vi nh gc sau bự chuyn ng Hỡnh 3.8: Kt qu chy chng trỡnh vi 200 frame nh u vo 3.2 Kt qu thc nghim t c tin hnh thc nghim v ỏnh giỏ, tỏc gi ó ci t cỏc thut toỏn tớm vộc t chuyn ng trờn hai phiờn bn: CPU v GPU NVIDIA vi CUDA Mỏy tỡnh c s dng tin hnh thc nghim l dũng laptop Asus x550CC, cú cỏc thụng s nh sau: 1) CPUIntel Core i3-2367M: - Chy h iu hnh Windows Ultimate - Tc chip: 4x1.4GHz - Ram: 4GB 2) GPUGeforce GT 620M (kin trỳc Fermi): - 96 nhõn CUDA cores - Graphics clock: 625MHz - Processor clock: 1250 MHz - Tc b nh d liu: 1800MHz - Bng thụng b nh: 14.40GB/s - B nh chia s: 1309MB 3) CUDA Platform: Phiờn bn CUDA 5.5.20 4) Cụng c lp trớnh: - Visual Studio 2012 - B th vin x lý nh mó ngun m Opencv ca Intel Cỏc thut toỏn c th nghim trờn cựng 05 b d liu bowing, news, hall_monitor, stefan v akiyo l cỏc file video cha cỏc frame nh tun t nh dng CIF (Common Interchange Format) vi phõn gii l 352x288 (mi b test gm 300 frame nh tun t) Cỏc b d liu ny c tỏc gi ly t ngun [21] õy l cỏc file video c nh dng y4m Tỏc gi ó tin hnh tỏch file ny thnh chui cỏc frame nh tun t nh dng PGM lm d liu u vo bng cỏch s dng phn mm FFmpeg c ti t a ch http://ffmpeg.zeranoe.com/builds (xem hớnh 3.8) Cỏc frame nh tun t di nh dng.PGM cú th xem trc bng phn mm MegaView (hớnh 3.10) Vỡ d kt qu tớm vộc t chuyn ng vi mt b test file Bowing c ch hớnh 3.11 v 3.12 Hỡnh 3.9 Giao din phn mmFFmpeg Hỡnh 3.10: Cỏc khung nh tun t c xem bng phn mm MegaView Hỡnh 3.11: Mt khung nh c trớch b test bowing Hỡnh 3.12: Vộc t chuyn ng ca khung nh hỡnh 3.11 Kt qu th nghim thi gian tỡnh toỏn v PSNR ca cỏc thut toỏn trờn 05 b test vi 200 frame hớnh u tiờn ca mi b video c a bng 3.1 v 3.2 di õy, ú thi gian tỡnh toỏn ch hin th tng thi gian x lý tỡnh toỏn trờn thut toỏn tớm kim vộc t chuyn ng trờn 200 frame (khụng tỡnh thi gian load nh, lu nh, tỡnh nh bự chuyn ng, d tha), PSNR c ly giỏ tr trung bớnh ca 200 ln tỡnh toỏn n v o thi gian c tỡnh bng giõy v n v o ca PSNR l dexiBen (dB) Bng 3.1: Thi gian tớnh toỏn ca cỏc thut toỏn trờn CPU (tớnh bng giõy) Thut toỏn/ B test FS TSS 4SS DS Bowing 2038.331875 12.846661 15.569562 9.817768 News 2559.813250 15.282288 10.871385 10.108587 Hall monitor 2446.311000 13.801118 13.001873 10.407841 Stefan 2089.043125 14.441059 10.928563 11.397841 Akiyo 2343.063250 17.432180 11.627490 8.030467 Bng 3.2: Thi gian tớnh toỏn ca cỏc thut toỏn trờn GPU (tớnh bng giõy) Thut toỏn/ B FS TSS 4SS DS test (GPU) (GPU) (GPU) (GPU) Bowing 11.058001 0.151952 0.170967 0.159158 News 11.088602 0.150468 0.128351 0.153477 Hall monitor 11.117293 0.150917 0.137564 0.151779 Stefan 9.491302 0.132743 0.172234 0.141025 Akiyo 11.072045 0.153897 0.114784 0.149619 Bng 3.3: Bng kt qu tớnh toỏn PSNR trung bỡnh (tớnh bng dexiBen) Thut toỏn/ B test FS TSS 4SS DS Bowing 39.360668 36.952538 31.401018 37.868690 News 35.797104 35.417931 29.882298 35.475140 Hall monitor 33.622837 33.534996 31.041786 33.548122 Stefan 24.281296 22.748426 17.894913 22.513706 Akiyo 41.925564 41.827778 39.27320 41.908497 Di õy l cỏc biu so sỏnh hiu nng ca cỏc thut toỏn v cht lng nộn video (da trờn PSNR) ca cỏc thut toỏn trờn 05 b d liu ó chn 500 Thi gian tớnh toỏn (s) 450 400 FS-CPU 350 TSS-CPU 300 TSS-GPU 250 FSS-CPU 200 FSS-GPU 150 DS-CPU 100 DS-GPU 50 FS-GPU bowing news hallmonitor stefan akiyo Cỏc b test Hỡnh 3.13: Biu so sỏnh hiu nng gia cỏc thut toỏn trờn GPU v CPU 45 40 PSNR (dB) 35 30 25 FS 20 3SS 15 4SS 10 DS bowing news hallmonitor stefan akiyo B test Hỡnh 3.14: Biu so sỏnh cht lng nộn video theo h s PSNR 3.3 ỏnh giỏ kt qu thc nghim t c Chỳng ta bit rng, thi gian tỡnh toỏn ca thut toỏn l thc o hiu nng ca thut toỏn ng trờn khỡa cnh ny, thi gian tỡnh toỏn ca cỏc thut toỏn tớm kim nhanh cú tc cao hn hn so vi thut toỏn tớm kim y (nhanh hn khong 150 n 200 ln tựy thuc vo tng b test) Tng t nh vy, tc tỡnh toỏn gim dn t thut toỏn Diamond Search (DS) n thut toỏn Four Steps Search (FSS) v cui cựng l thut toỏn Three Steps Search (TSS) iu ny hon ton ỳng n s lng cỏc im cn kim tra ca cỏc thut toỏn ny gim dn t thut toỏn FS, TSS, FSS v cui cựng l DS Cng t bng 3.1, bng 3.2 v biu 3.13 ta thy hiu nng tỡnh toỏn trờn GPU nhanh hn hang trm ln so vi CPU, tựy vo tng b test v thut toỏn i vi thut toỏn FS, tc tng tc ca thut toỏn GPU so vi CPU lờn n hn 250 ln, cũn vi cỏc thut toỏn tớm kim nhanh thớ tc tng tc ca GPU t 60 n 100 ln (tựy thut toỏn v b test) Vic thut toỏn FS trờn GPU tng tc hn cỏc thut toỏn xp x trờn GPU l thut toỏn ny mang tỡnh song song húa cao hn cỏc thut toỏn tớm kim nhanh, cỏc thut toỏn tớm kim nhanh cú nhiu cõu lnh r nhỏnh kim tra, lm gim cht lng song song húa trờn GPU Nu ỏnh giỏ trờn phng din cht lng nộn video, chỳng ta s da vo biu so sỏnh giỏ tr t s tỡn hiu nh trờn nhiu (PSNR) hớnh 3.14 Thut toỏn FS luụn cho kt qu tt nht, ú cỏc thut toỏn tớm kim nhanh cho giỏ tr ri vo khong t [31.041786,41.908497] dB (ngoi tr b test stefan ch cho kt qu t [17.894913, 24.281296]) Trờn thc t, cht lng nộn chp nhn c dao ng mc [30, 50] dB Nh vy, l cht lng ca cỏc thut toỏn tớm kim nhanh t gn nh mong mun Cht lng ca nú s tng lờn nu cht lng nh u vo tt hn (tng s lng frame nh video) Ta cng nhn thy rng, cht lng nộn t l thun vi thi gian tỡnh toỏn ca cỏc thut toỏn Thut toỏn tớm kim y (FS) cú tc chm nht nhng cho cht lng tt nht (luụn cú giỏ tr PSNR trờn 30dB chp nhn c), ú cỏc thut toỏn TSS, FSS v DS cho cht lng gim dn So sỏnh vi mt s cụng trỡnh nghiờn cu liờn quan: - Tỏc gi Trn Mnh Tun cng nghiờn cu v cỏc phng phỏp c lng chuyn ng nộn video [2], nhng tỏc gi Trn Mnh Tun ch trung vo vic xut thut toỏn ci tin t cỏc thut toỏn Bayes ó cú: thut toỏn Kalman Thut toỏn Kalman cho tc tỡnh toỏn tt hn Bayes, chỡnh xỏc c lng chuyn ng tt hn Tỏc gi Trn Mnh Tun ch ci t thut toỏn trờn CPU nờn nu so sỏnh vi cỏc thut toỏn song song húa trờn GPU c tỏc gi nghiờn cu v trớnh by lun ny thớ thi gian tỏc gi Trn Mnh Tun xut chm hn rt nhiu (lờn ti hng trm giõy), thut toỏn tỏc gi xut lun ny ch vi giõy Cu hỡnh phn cng tỏc gi s dng: Tỏc gi khụng cp, ch cp cỏc s liu ó c tỏc gi tớnh toỏn - Eralda Nishani, Betim Cico, Neki Frashởri cng nghiờn cu tng hiu nng tớm kim vộc t chuyn ng nộn video vi cỏc card GPU [7] Cỏc tỏc gi ny cng tin hnh ci t cỏc thut toỏn TSS, 4SS v FS trờn card NVIDIA s dng CUDA Tuy nhiờn, s lng thut toỏn c cỏc tỏc gi ny ci t v nghiờn cu khụng phong phỳ nh kt qu nghiờn cu ca tỏc gi ó trớnh by lun vn, ng thi hiu nng ca cỏc thut toỏn khụng tt bng kt qu ca lun ny (tng tc so vi CPU t 41 n 80 ln - kt qu nghiờn cu ca tỏc gi trớnh by lun l hng trm ln) Cu hỡnh phn cng tỏc gi s dng: + CPU: AMD Athlon II X3 455 - Tc x lý: 800 Hz - H iu hnh: RedHat + Card ha: NVIDIA QUADRO 400: - 48 nhõn CUDA cores - Graphics clock: 450Mhz - Processor clock: 800 MHz - Tc b nh d liu: 1600Mhz - Bng thụng b nh: 12.3 GB/s - B nh chia s: 16384 B - K Shuma Roshini, M Tejaswi cng nghiờn cu song song húa thut toỏn tớm kim kim cng cho bi toỏn tớm kim vộc t chuyn ng vi GPU v CUDA [6] Cỏc tỏc gi ny cng ỏnh giỏ trờn cỏc b d liu chun m h s dng Tuy nhiờn, theo bỏo cỏo, kt qu tng tc ca ci t ny so vi CPU ch gp ln v thc thi trờn GPU chm hn thut toỏn tỏc gi xut lun ny ti hn 10 ln Cu hớnh phn cng tỏc gi s dng: +CPU: Tỏc gi khụng cp, tỏc gi ch s dng s liu tỏc gi ó tỡnh toỏn + Card ha: GT GeForce 610(kin trỳc Fermi): - 48 nhõn CUDA cores - Graphics clock: 810 MHz - Processor clock: 1066 MHz - Tc b nh d liu: 1796 MHz - Bng thụng b nh: 14.4 GB/s - B nh chia s: 16384 B - Eduarda R Monteiro, Bruno B Vizzotto, Clỏudio M Diniz, Bruno Zatt, SergioBampi cng nghiờn cu tng tc tớm kim vộc t chuyn ng nộn cỏc video chun H.264/AVC s dng thut toỏn Fullsearch v card GPU vi cụng ngh CUDA [5] tng tc so vi CPU ca bi bỏo ny l hn 66 ln, i vi Fullsearch, thut toỏn ca tỏc gi nghiờn cu lun ny tng tc ti hng trm ln Cu hớnh tỏc gi s dng: + CPU: Intel Core Quad Q9550 - Tc x lý: 2,82 GHz - H iu hnh: Tỏc gi khụng cp + Card ha: NVIDIA GTX 480 (kin trỳc Fermi) - 1.40 GHz - 48 nhõn CUDA cores - Graphics clock: 700 MHz - Processor clock: 1401 MHz - Tc b nh d liu: 1536 MHz - Bng thụng b nh: 177.4 GB/s - B nh chia s: 49152 B Nh võy, hng nghiờn cu ca lun cú ý ngha khoa hc v thc tin, úng gúp mt phn quan trng vo vic nghiờn cu gii phỏp tng tc nộn video, s dng cỏc cụng vic truyn video thi gian thc s dng k thut d oỏn bự chuyn ng m bn cht ca nú quy v bi toỏn tớm kim vộc t chuyn ng KT LUN V KIN NGH Trong khuụn kh lun vn, tỏc gi ó nghiờn cu khỏ chi tit v cụng ngh nộn video, k thut nộn video theo chun MPEG Trong ú, chng tỏc gi trung i sõu nghiờn cu v k thut c lng v bự chuyn ng, m quan trng nht ú l thut toỏn so khp tớm vộc t chuyn ng, mt cụng vic quan trng nộn video hớnh dung c thut toỏn d dng hn, tỏc gi tip cn phng phỏp so khp da trờn thut toỏn tớm kim y Sau ú, tỏc gi trung nghiờn cu cỏc thut toỏn tớm kim nhanh (xp x) nh: tớm kim ba bc, 2D logarit, ba bc mi, bn bc, trc giao, kim cng nhm ỏp ng nhu cu nộn video thi gian thc Nhm tng tc hn na cỏc thut toỏn ny, chuong tỏc gi ó tin hnh nghiờn cu v ci t song song cỏc thut toỏn ny trờn thit b NVIDIA s dng cụng ngh song song d liu CUDA thc hin cụng vic ny, tỏc gi ó tin hnh nghiờn cu cỏc k thut tỡnh toỏn song song, nghiờn cu kin trỳc card ca hóng NVIDIA v cụng ngh lp trớnh song song d liu vi CUDA Cui cựng, t nhng kt qu nghiờn cu c chng v chng 2, chng tỏc gi tin hnh ci t, thc nghim v ỏnh giỏ cỏc thut toỏn tớm kim vộc t chuyn ng nhanh trờn thit b NVIDIA s dng cụng ngh CUDA Kt qu chng cho thy, vic tỡnh toỏn vộc t chuyn ng trờn thit b cho tc rt cao (gp khong hng chc n vi trm ln so vi bn ci t tng ng trờn CPU) Ngoi ra, cht lng nộn video (c ỏnh giỏ trờn giỏ tr t s tỡn hiu nh trờn nhiu PSNR) cng mc chp nhn c Giỏ tr ny s c nõng cao hn na nu cht lng u vo ca cỏc video tt hn Do thi gian v kinh phỡ thc hin lun cú hn, nờn ni dung lun vn cũn tn ti nhng hn ch C th, tỏc gi cha ci t c ton b cỏc thut toỏn ó nghiờn cu (ch dng li 04 thut toỏn) v mi ch ỏnh giỏ c trờn s ỡt cỏc b test (05 b d liu chun) Vic thc nghim trờn card NVIDIA mi ch dng li 01 b card bớnh dõn (cú cu hớnh cha cao) nờn cha ỏnh giỏ c y v chỡnh xỏc nht hiu qu ca cỏc thut toỏn cng nh u th ca cỏc thit b so vi CPU Trong thi gian ti, tỏc gi s tip tc nghiờn cu v khc phc nhng im hn ch trờn lun c hon thin hn TI LIU THAM KHO Ting Vit [1] Nguyn Thanh Bớnh, Vừ Nguyn Quc Bo (2007), X l õm thanh, hỡnh nh, Hc vin Cụng ngh Bu chỡnh Vin thụng, H Ni [2] Trn Mnh Tun (2013), Nộn nh thụng tin s th h sau, Lun ỏn Tin s chuyờn ngnh K thut Vin thụng, Hc vin Cụng ngh Bu chỡnh Vin thụng [3] Nguyn Th Thựy Linh (2009), Tớnh toỏn hiu nng cao vi b l GPU v ng dng, Lun thc s, i hc Cụng nghip - i hc quc gia H Ni, tr 17-60 [4] Trng Vn Hiu (2011), Nghiờn cu cỏc gii thut song song trờn h thng l GPU a lừi, Lun thc s k thut, i hc Nng Ting Anh [5] Eduarda R Monteiro, Bruno B Vizzotto, Clỏudio M Diniz, Bruno Zatt, SergioBampi (2011), "Multiprocessing Acceleration of H.264/AVC Motion Estimation Full Search Algorithm under CUDA Architecture", SIM [6] K Shuma Roshini, M Tejaswi (2013), "Implementation of Diamond Search Algorithm Using Parallel Processing Architecture", ISSN : 2248-9622, Vol 3, Issue 6, pp.338341 [7] Eralda Nishani, Betim ầiỗo, Neki Frashởri (2013), "Investigating the performance of motion estimation block matching algorithms on GPU cards", BCI'13 September 19-21, Thessaloniki, Greece, [8] T Koga, K Iinuma, A Hirano, Y Iijima and T Ishiguro (1981), "Motion compensated interframe coding for video conferencing", Pro Nat Telecommun Conf., New Orleans, pp G5.3.1-5.3.5, [9] J R Jain and A K Jain (1981), Displacement measurement and its application in interframe image coding, IEEE Trans on Communications, Vol COM-29, No 12, pp 1799-1808 [10] A Puri, H M Hang and D L Schilling (1987), An efficient block matching algorithm for motion compensated coding, Proc.IEEE Int Conf Acoust., Speech, and Signal Proc., pp 1063-1066 [11] M Ghanbari (1990), The cross search algorithm for motion estimation,IEEE Trans Commun., Vol COM-38, pp 950-953 [12] R Li, B Zeng and M L Liou (1994), "A new three step search algorithm for block motion estimation", IEEE Trans on Circuits and Systems for Video Technology, Vol 4, No 4, pp 438-442 [13] L M Po and W C Ma (1996), A novel four-step search algorithm for fast block motion estimation,IEEE Trans on Circuits and Systems for Video Technology, Vol 6, No 3, pp 313-317 [14] Lurng-Kuo Liu and Ephraim Feig (1996), A block based gradient descent search algorithm for block motion estimation in video coding,IEEE Trans on Circuits and Systems for Video Technology, Vol 6, No 4, pp.419-422 [15 S Zhu and K K Ma (2000), A new diamond search algorithm for fast block matching motion estimation, IEEE Trans Image Processing, Vol 9, No 2, pp 287290 [16] L Hanzo, P J Cherriman and J Streit (2007), Video Compression and Communications, John Wiley & Sons, England [17] Biemond J., L Looijenga, D E Boekee and R H J M Plompen (1987), A Pel Recursive Wiener-Based Displacement Estimation Algorithm, Signal Processing, 13, pp 399-412 [18] Daniel Panturu (1998), Bayesian Motion Estimation Using Video Frame Differences, Doctor of philosophy, Texas Tech University [19] J R Jain and A K Jain (1981), Displacement Measurement and Its Application in Interframe Image Coding,IEEE Transactions on Communications, 29(12), pp 17991808 [20] Francesc Massanes, Marie Cadennes and Jovan G Brankov (2010), CUDA implementation of a block-matching algorithm for Multiple GPU cards, Illinois Institute of Technology, Medical Imaging Research Center, Chicago IL 60616, USA [21] Test sequences - Xiph.org Video Test Media http://media.xiph.org/video/derf/ [...]... Nghiên cứu tăng tốc độ tím kiếm véc tơ chuyển động trong nén video sử dụng kiến trúc song song GPU NVIDIA và công nghệ CUDA Nội dung luận văn gồm phần mở đầu, phần kết luận và ba chƣơng với nội dung cụ thể nhƣ sau: Chƣơng 1: Tổng quan về bù chuyển động và các thuật toán để tìm véc tơ chuyển động trong nén video Nội dung chình của chƣơng này là giới thiệu tổng quan về kỹ thuật bù chuyển động trong nén video. .. theo chuẩn MPEG và các thuật toán để tím kiếm véc tơ chuyển động trong thuật toán so sánh khối Chƣơng 2: Tổng quan về cấu trúc hệ thống xử lý đồ họa GPU và công nghệ tính toán song song dữ liệu CUDA Trong chƣơng này, tác giả giới thiệu những kiến thức đại cƣơng về tình toán song song, cấu trúc của hệ thống xử lý dữ liệu đồ họa GPU và công nghệ tình toán song song dữ liệu CUDA của hãng NVIDIA Chƣơng 3:... bằng 0 Về lý thuyết, chuyển động cận cảnh cũng có thể tạo ra độ lợi mã bổ sung Trong thực tế, các vật thể chuyển động tùy thuộc vào tình khăng khìt, chuyển động quay và mềm dẻo, các biến đổi độ sáng mà làm giảm độ lợi mã hóa có thể đạt đƣợc Các hệ thống bù chuyển động sử dụng các phƣơng pháp ƣớc lƣợng chuyển động làm tăng mạnh cả hai độ lợi mã nền và cận cảnh Chúng tạo ra mã vi sai trong khung thuần tuý... những năm 1960 và đƣợc sử dụng để nâng cao hiệu suất của các bộ nén video Các bộ mã video bù chuyển động đƣợc thực hiện theo ba giai đoạn: - Giai đoạn 1: Ƣớc lƣợng chuyển động của mục tiêu (ƣớc lƣợng chuyển động) giữa khung tái cấu trúc trƣớc đó và khung hiện tại - Giai đoạn 2: Tạo ra dự đoán khung hiện tại (bù chuyển động) bằng cách sử dụng các ƣớc lƣợng chuyển động và khung tái cấu trúc trƣớc đó - Giai... nhà nghiên cứu vi xử lý đã chuyển hƣớng sang phát triển công nghệ đa lõi với cơ chế xử lý song song trong các máy tình Trong những năm gần đây, một trong những hƣớng nghiên cứu nhiều tiềm năng là sử dụng chip đồ họa GPU và công nghệ xử lý song song CUDA do hãng NVIDIA phát triển nhằm tăng tốc độ xử lý, nâng cao hiệu quả của thuật toán Xuất phát từ những phân tìch ở trên, tác giả đã chọn đề tài Nghiên. .. thu đƣợc các véc tơ chuyển động theo tiêu chì tối thiểu hóa sai số giữa khối cần tím véc tơ chuyển động và mỗi khối ứng cử Các véc tơ chuyển động và khung tái cấu trúc trƣớc đó đƣợc đƣa vào bộ bù chuyển động để tạo ra dự đoán (Hính 1.13) Hình 1.13: Minh họa quá trình bù chuyển động theo giải thuật BMA [1] 1.2 Các thuật toán để tìm véc tơ chuyển động Các thuật toán BMA dự đoán chuyển động của một khối... đoán và khung thực hiện tại nhƣ là sai số dự đoán Máy thu tái cấu trúc ảnh hiện tại bằng cách sử dụng các ƣớc lƣợng chuyển động đƣợc mã hóa VLC và sai số dự đoán đƣợc mã hóa VLC theo không gian Ƣớc lƣợng và bù chuyển động là các kỹ thuật phổ biến đƣợc dùng để mã hóa về mặt thời gian của tìn hiệu video Các kỹ thuật bù chuyển động khối và ƣớc lƣợng chuyển động đƣợc sử dụng trong các hệ thống nén video. .. trình và các kết quả thử nghiệm đạt đƣợc Từ những kiến thức đã nghiên cứu đƣợc ở chƣơng 1 và chƣơng 2, trong chƣơng 3 tác giả tiến hành xây dựng ứng dụng song song hóa các thuật toán tím véc tơ chuyển động trên thiết bị đồ họa của hãng NVIDIA sử dụng công nghệ CUDA và tiến hành thực nghiệm, đánh giá các kết quả đạt đƣợc trên các bộ test chuẩn CHƢƠNG 1 TỔNG QUAN VỀ BÙ CHUYỂN ĐỘNG VÀ CÁC THUẬT TOÁN ĐỂ TÌM... TOÁN ĐỂ TÌM VÉC TƠ CHUYỂN ĐỘNG TRONG NÉN VIDEO 1.1 Tổng quan về bù chuyển động trong MPEG 1.1.1 Khái niệm về nén video Trong lĩnh vực truyền thông video, kỹ thuật xử lý tìn hiệu chủ yếu tập trung vào mục đìch nén Ngƣời ta thƣờng sử dụng 3 phƣơng pháp nén đối với hính ảnh dựa vào các loại độ dƣ: dƣ thừa không gian, dƣ thừa phổ và dƣ thừa tâm sinh lý nhín Nén về cơ bản là một quá trính trong đó số lƣợng... 1.12) ( [ ( Trong đó, ) ] ( ) ) là kìch thƣớc bƣớc của lƣới và điểm của lƣới theo chiều ngang và chiều dọc ⁄ , ⁄ là số lƣợng Hình 1.12: Chia cửa sổ tìm kiếm dƣới dạng lƣới theo BMA - Bù chuyển động ( Motion Compensation): Ƣớc lƣợng độ dịch chuyển của mục tiêu chuyển động từ khung tham chiếu đến khung hiện tại Ƣớc lƣợng chuyển động thu đƣợc dự đoán bù chuyển động bằng cách tím véc tơ chuyển động giữa ... cam đoan luận văn Thạc sĩ: Nghiên cứu tăng tốc độ tìm kiếm véc tơ chuyển động nén video sử dụng kiến trúc song song GPU NVIDIA công nghệ CUDA ” công trính nghiên cứu riêng Các số liệu, kết đƣợc... song song CUDA hãng NVIDIA phát triển nhằm tăng tốc độ xử lý, nâng cao hiệu thuật toán Xuất phát từ phân tìch trên, tác giả chọn đề tài Nghiên cứu tăng tốc độ tím kiếm véc tơ chuyển động nén video. .. chuyển động tùy thuộc vào tình khăng khìt, chuyển động quay mềm dẻo, biến đổi độ sáng mà làm giảm độ lợi mã hóa đạt đƣợc Các hệ thống bù chuyển động sử dụng phƣơng pháp ƣớc lƣợng chuyển động làm tăng

Ngày đăng: 18/12/2016, 00:33

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan