Chuẩn bị dữ liệu trong việc xây dựng cơ sở dữ liệu video số

12 303 0
Chuẩn bị dữ liệu trong việc xây dựng cơ sở dữ liệu video số

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

https://mkienthuc.blogspot.com/2017/06/khao-sat-va-tinh-toan-kiem-nghiem-he-thong-phanh-huyndai.html https://mkienthuc.blogspot.com/2017/06/khao-sat-va-tinh-toan-kiem-nghiem-he-phanh-xe-nang-hang.html https://mkienthuc.blogspot.com/2017/06/khao-sat-he-thong-nhien-lieu-dong-co-Cummins-xe-International.html

`eu khiˆe’n ho.c, T.23, S.2 (2007), 141–152 Ta.p ch´ı Tin ho.c v` a Diˆ ˆ U TRONG VIE ˆ C XAY ˆ DU .NG ˆ’ N BI DU ˜ LIE CHUA ’ ˜ ˆ ˆ´ CO SO DU LIE.U VIDEO SO ˆ˜ TRUNG TUA ˆ´N2 , DO ˆ˜ XUAN ˆ TIE ˆ´N1 ˆ CU.O.NG1 , DO LU O NG XUAN Ho.c viˆe.n K˜y thuˆ a.t Quˆ an su , Email: lxcuong2002@yahoo.com; dxtienvxl@yahoo.com Dai hoc Quˆ o´c gia H` a Nˆ o.i, Email tuandt@hep.edu.vn Abstract Preparing video data is an important step in the construction of digital video databases This work demands segmenting a video sequence into shots, which are basic meaning units of video data In this paper, a method to prepare video data is proposed consisting of a shot boundary detection technique on the basis of tracking camera motion through the background areas to the video frame (background tracking) and of some other steps to discard noise and to reduce false segmentation for increasing the accuracy of the video stream segmentation Measures to be taken to overcome the problem of object’s and camera’s motion are proposed and an enhanced algorithm for segmenting video data is also reported ´t Chuˆ T´ om t˘ a a’n bi d˜ u liˆe.u video l` u liˆe.u a mˆ o.t bu.´o.c quan tro.ng qu´a tr`ınh xˆ ay du ng co so’ d˜ `au phˆ (CSDL) video sˆ o´ N´ o luˆ on yˆeu cˆ an chia chuˆ o˜i video th` anh c´ac lia (shot), l` a n vi co ba’n c´o `e xuˆa´t mˆ o.t phu.o.ng ph´ ngh˜ıa cu’a d˜ u liˆe.u video B` b´ ao dˆ ap chuˆ a’n bi d˜ u liˆe.u video, bao gˆ o`m: k˜y `en cu’a c´ac khung video, mˆ u a c´ac lia video du a trˆen d´ thuˆ a.t ph´ at hiˆe.n gianh gi´ o i gi˜ anh dˆ a´u v` ung nˆ o.t ˜eu v` `a m t˘ sˆ o´ biˆe.n ph´ ap gia’m nhiˆ a c´ac ph´ at hiˆe.n sai nh˘ ang kha’ n˘ ang phˆ an chia mˆ o.t c´ach ch´ınh x´ ac `e chuyˆe’n dˆ a.t to´ an d` ong video; mˆ o.t sˆ o´ biˆe.n ph´ ap kh˘a´c phu.c vˆ a´n dˆ o.ng cu’a camera v` a dˆ o´i tu.o ng; thuˆ u liˆe.u video cho ph´ep nˆ ang cao kha’ n˘ ang phˆ an doa.n d˜ ˘ T VA ˆ´N D`E ˆ DA Trong mˆoi tru.`o.ng da phu.o.ng tiˆe.n, d˜ u liˆe.u video l`a mˆo.t da.ng d˜ u liˆe.u d˘a.c biˆe.t v´o.i nh˜ u.ng d˘a.c t´ınh nˆo’i bˆa.t nhu k´ıch thu ´o c l´o n, nˆo.i dung ng˜ u ngh˜ıa tr` u u tu o ng, c´o c´ac quan hˆe khˆong `au su’ du.ng video ng`ay c`ang t˘ang gian - th`o i gian, tˆo´c dˆo d`ong d˜ u liˆe.u cao Hiˆe.n nhu cˆ cao, d`oi ho’i pha’i xˆay du ng c´ac CSDL video Qu´a tr`ınh thiˆe´t kˆe´ v`a xˆay du ng c´ac CSDL video `eu cˆong doa.n ph´ u.ng bu.´o.c rˆa´t quan tro.ng l`a chuˆa’n bi d˜ u d`oi ho’i rˆa´t nhiˆ u.c ta.p Mˆo.t nh˜ `en thˆo´ng (d˜ liˆe.u Kh´ac v´o.i loa.i d˜ u liˆe.u truyˆ u liˆe.u sˆo´, v˘an ba’n), d˘a.c t´ınh d˘a.c biˆe.t cu’a m`ınh, `au tiˆen quyˆe´t Mˆo h`ınh h´oa d˜ mˆo h`ınh h´oa d˜ u liˆe.u video luˆon du o c d˘a.t nhu mˆo.t yˆeu cˆ u `e tr`ınh b`ay d˜ liˆe.u video liˆen quan dˆe´n vˆa´n dˆ u liˆe.u video, d´o l`a viˆe.c thiˆe´t kˆe´ t´om t˘a´t m´ u.c cao `eu kiˆe.n cho c´ac hoa.t dˆo.ng kh´ac nhu ch`en, biˆen tˆa.p, chı’ sˆo´ h´oa, duyˆe.t v`a cu’a video thˆo, ta.o diˆ `au tiˆen cu’a ´ u liˆe.u video thu.`o.ng l`a viˆe.c l`am dˆ truy vˆa n d˜ u liˆe.u video V`ı vˆa.y, mˆo h`ınh h´oa d˜ `au hˆe´t c´ac qu´a tr`ınh chuˆa’n bi d˜ u liˆe.u d`oi ho’i d˜ u liˆe.u video qu´a tr`ınh chuˆa’n bi d˜ u liˆe.u video Hˆ `an du.o c phˆan chia theo th`o.i gian th`anh c´ac doa.n co so’ c´o ngh˜ıa Sau d´o l`a c´ac bu.´o.c t´om cˆ t˘a´t m´ u.c cao, chı’ sˆo´ h´oa 142 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN 1.1 Mˆ o h`ınh h´ oa d˜ u liˆ e.u Phˆan doa.n d˜ u liˆe.u video theo th`o.i gian nh˘`a m mu.c d´ıch phˆan chia d`ong video liˆen tu.c th`anh c´ac n vi co so’ c´o y´ ngh˜ıa l`a c´ac lia (shot) ho˘a.c c´ac ca’nh (scene) Trong d´o, lia du.o c coi l`a mˆo.t do.n vi vˆa.t l´ y cu’a d`ong video N´o l`a mˆo.t tˆa.p ho p c´ac khung video liˆen tiˆe´p thu `e m˘a.t khˆong u mˆo.t hoa.t dˆo.ng camera do.n Nhu vˆa.y gi˜ u.a c´ac khung c´o su liˆen tu.c vˆ du o c t` ’ ` ’ u ngh˜ıa) cu’a d`ong gian-th`o i gian Trong canh la.i du o c hiˆe u l`a mˆo.t n vi logic (vˆe m˘a.t ng˜ `e m˘a.t khˆong gian v`a/ho˘a.c th`o.i video Ca’nh c´o thˆe’ gˆo`m mˆo.t ho˘a.c mˆo.t sˆo´ lia c´o su liˆen quan vˆ u ngh˜ıa n`ao d´o Phˆan doa.n video thu c chˆa´t l`a ph´at hiˆe.n gian c` ung mang dˆe´n mˆo.t ng˜ u.a c´ac lia ho˘a.c c´ac ca’nh C´ac k˜ y thuˆa.t phˆan doa.n mˆo.t chuˆo˜i video (sequence) gianh gi´o.i gi˜ ’ `eu l´o p, t` uy theo viˆe.c lu a cho.n (i) c´ac d˘a.c tru.ng cu’a d˜ u liˆe.u video c´o thˆe chia th`anh nhiˆ video dˆe’ so s´anh, (ii) c´ac phu o ng ph´ap so s´anh, (iii) dˆo´i tu.o ng video thu c hiˆe.n phˆan doa.n C´ac k˜ y thuˆa.t phˆan doa.n d˜ u liˆe.u video chu’ yˆe´u du a v`ao nˆo.i dung h`ınh a’nh - ˆam cu’a u.a c´ac khung dˆe’ ph´at hiˆe.n gianh gi´o.i gi˜ u.a c´ac lia (c´ac video, thu c hiˆe.n da.c su kh´ac gi˜ chuyˆe’n lia) 1.2 Mu.c d´ıch cu’a b` b´ ao u liˆe.u video d˜a du.o c su’ du.ng cho xˆay B`ai b´ao tr`ınh b`ay mˆo.t phu.o.ng ph´ap chuˆa’n bidu ng CSDL video c´ac hˆe thˆo´ng camera gi´am s´at an ninh C´ac hˆe thˆo´ng n`ay su’ du.ng `eu loa.i camera: loa.i d´ u.ng yˆen quan s´at mˆo.t khˆong gian cˆo´ di.nh; loa.i chuyˆe’n dˆo.ng nhiˆ `eu kiˆe’u qu´et, quay, zoom kh´ac D`ong d˜ u liˆe.u video thu du.o c t` u hˆe thˆo´ng v´o.i nhiˆ u liˆe.u camera quan s´at chi.u a’nh hu o’ ng cu’a chuyˆe’n dˆo.ng cu’a camera v`a/ho˘a.c dˆo´i tu o ng D˜ video c´ac hˆe thˆo´ng n`ay c´o c´ac d˘a.c diˆe’m riˆeng: sˆo´ lu.o ng d˜ u liˆe.u l´o.n; cˆa´u tr´ uc d˜ u liˆe.u `au xˆay du ng mˆo u c ta.p; yˆeu cˆ theo chuˆa’n riˆeng; d`ong video c´o pha’n ´anh c´ac chuyˆe’n dˆo.ng ph´ ` ´ ´ ´ `an ’ h`ınh d˜ u liˆe.u riˆeng; c´ac yˆeu cˆau truy vˆa n, t`ım kiˆem dˆoi tu o ng video l`a chu yˆe´u Do d´o cˆ `eu dˆe´n chuˆa’n bi d˜ u liˆe.u v`ao CSDL Trong d´o d˘a.c biˆe.t u liˆe.u tru ´o c thu thˆa.p d˜ ch´ u y´ nhiˆ ` ´ ´ nh˘a m v`ao mˆo.t sˆo k˜ y thuˆa.t m´o i v`a c´ac biˆe.n ph´ap ca’i tiˆen nh˘`a m nˆang cao hiˆe.u qua’ phˆan doa.n `an tiˆe´p theo cu’a b`ai b´ao tr`ınh b`ay mˆo.t sˆo´ gia’i ph´ap: (i) Phu.o.ng ph´ap d˜ u liˆe.u video C´ac phˆ `en ung nˆ ph´at hiˆe.n c˘a´t lia du a trˆen d´anh dˆa´u v` ’ ´ ` ´ ’ (ii) Kh˘ac phu.c vˆa n dˆe chuyˆe n dˆo.ng cua camera v`a dˆo´i tu.o ng (iii) Nˆang cao hiˆe.u qua’ phˆan doa.n video ´ ´ PHAT ´ HIE ˆ N CA ˘ T LIA PHU O NG PHAP `ˆ ˆ ´ ˆ´ ` DU A TREN DANH DAU VUNG NEN `au cu’a vˆ `e 2.1 Cu thˆ e’ h´ oa yˆ eu cˆ a´n dˆ Mˆo.t d`ong video gˆo`m n khung (f1, f2 , , fn) c´o thˆe’ xem nhu mˆo.t chuˆo˜i c´ac khung a’nh t˜ınh (frame) nˆo´i tiˆe´p v`a cu.`o.ng dˆo s´ang cu’a mˆo.t diˆe’m a’nh c˜ ung l`a mˆo.t h`am cu’a th`o.i gian f (x, y, t) C´ac chuyˆe’n lia thˆe’ hiˆe.n d˜a c´o mˆo.t su thay dˆo’i n`ao d´o cu’a khˆong gian v`a/ho˘a.c u.a c´ac lia ([4]) C´o hai loa.i chuyˆe’n lia l`a c´ac c˘a´t lia (chuyˆe’n lia dˆo.t ngˆo.t) v`a c´ac th`o.i gian gi˜ u chuyˆe’n lia t` u t` `eu c´o chung mu.c d´ıch l`a ph´at hiˆe.n t´ınh khˆong liˆen tu.c C´ac thuˆa.t to´an ph´at hiˆe.n c˘a´t lia dˆ `e then chˆo´t l`a cho.n th`o i gian nˆo.i dung h`ınh a’nh cu’a mˆo.t chuˆo˜i video Trong d´o vˆa´n dˆ `an biˆe’u thi d˘a.c t´ınh (c´ac d˘a.c t´ınh) dˆe’ biˆe’u diˆ˜en nˆo.i dung h`ınh a’nh D˘a.c t´ınh du.o c cho.n cˆ ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY ˆ DU CHUA NG 143 c´ac thuˆo.c t´ınh giˆo´ng nˆe´u c´ac a’nh n˘`a m c` ung mˆo.t lia, nhu.ng s˜e thay dˆo’i r˜o rˆe.t nˆe´u ch´ ung n˘`a m c´ac lia kh´ac Hiˆe.n d˜a c´o mˆo.t sˆo´ thuˆa.t to´an ph´at hiˆe.n c˘a´t lia ([2, 7, 11]), nhu c´ac thuˆa.t to´an du a trˆen so s´anh o’ m´ u.c pixel; thuˆa.t to´an du a trˆen so s´anh d˘a.c t´ınh m`au, biˆe’u dˆo` m`au; c´ac thuˆa.t to´an du a trˆen d˘a.c t´ınh ca.nh; c´ac thuˆa.t to´an du a trˆen chuyˆe’n dˆo.ng cu’a dˆo´i tu.o ng; c´ac thuˆa.t to´an du a trˆen c´ac tham sˆo´ cu’a video n´en; ngo`ai ra, c`on c´o mˆo.t sˆo´ phu.o.ng ph´ap nh˘`a m v`ao u.c cao cu’a video c´ac d˘a.c t´ınh h`ınh a’nh m´ `e xuˆa´t mˆo.t phu.o.ng ph´ap ph´at C´ac t´ac gia’ d˜a dˆ hiˆe.n gianh gi´o i lia (PRL) ([9]) du a trˆen viˆe.c d´anh `en khung ung nˆ dˆa´u du.`o.ng di chuyˆe’n camera qua v` y thuˆa.t nh˘`a m gia’m nhiˆ˜eu dˆe’ video, c` ung v´o i c´ac k˜ t˘ang kha’ n˘ang ph´at hiˆe.n ch´ınh x´ac gianh gi´o.i c´ac lia K˜ y thuˆa.t PRL n`ay du a trˆen hai co so’ sau: ung d˘a.c biˆe.t trˆen c´ac khung a’nh Lu a cho.n c´ac v` video dˆe’ d´anh dˆa´u du.`o.ng di chuyˆe’n cu’a camera nh˘`a m t˘ang hiˆe.u qua’ cho thuˆa.t to´an so s´anh gi˜ u.a c´ac khung PRL; Vˆa.n du.ng k˜ y thuˆa.t n´en a’nh theo phu.o.ng ph´ap Th´ap Gauss (Gaussian Pyramid) [6, 8] dˆe’ gia’m nho’ k´ıch thu.´o.c a’nh phu.c vu cho PRL Khi mˆo.t lia du.o c thu c hiˆe.n t` u mˆo.t hoa.t dˆo.ng camera, theo vˆe´t di chuyˆe’n cu’a camera l`a mˆo.t c´ach `en cˆo´ di.nh H`ınh V` ung nˆ u.a c´ac lia C´o thˆe’ l`am dˆe’ x´ac di.nh gianh gi´o.i gi˜ `en c´ac khung video V` `en (VNC) du.o c du.o c viˆe.c n`ay b˘`a ng c´ach d´anh dˆa´u v` ung nˆ ung nˆ di.nh ngh˜ıa nhu H`ınh L´ı cho.n VNC c´ac khung video c´o da.ng ch˜ u π : (i) tru.´o.c hˆe´t `an thˆe’ hiˆe.n c´ac dˆo´i tu.o ng hay c`on go.i l`a v` `an d´ay cu’a mˆo.t khung thu.`o.ng l`a phˆ ung l`a phˆ `en ch˜ cˆa.n ca’nh, hay v` ung dˆo´i tu.o ng (VDT); (ii) v` ung nˆ u nhˆa.t nho’ trˆen dı’nh pha’n ´anh chuyˆe’n dˆo.ng ngang cu’a camera; (iii) hai cˆo.t tr´ai/ pha’i pha’n ´anh chuyˆe’n dˆo.ng do.c cu’a camera Kˆe´t y theo hu.´o.ng du.`o.ng ch´eo ho p gi˜ u.a v` ung dı’nh v`a c´ac cˆo.t c´o thˆe’ va.ch chuyˆe’n dˆo.ng bˆa´t k` `en, ta c´o thˆe’ thu c hiˆe.n k˜ y thuˆa.t PRL thˆong qua viˆe.c x´ac ung nˆ Du a trˆen c´ach x´ac di.nh v` ` ` u dˆo ph´ di.nh m´ u c dˆo phˆan biˆe.t VNC cu’a hai khung liˆen kˆe M˘a.c d` u.c ta.p cu’a thuˆa.t to´an c´o u la.i phu o ng ph´ap n`ay la.i to’ hiˆe.u qua’ trˆen c´ac phu.o.ng diˆe.n sau: t˘ang, nhu ng b` `an so s´anh khˆong pha’i l`a to`an bˆo khung Sˆo´ lu.o ng ph´ep so s´anh gia’m k´ıch thu.´o.c v` ung cˆ Gia’m du.o c ph´at hiˆe.n sai d´ang kˆe’ so v´o.i mˆo.t sˆo´ phu.o.ng ph´ap kh´ac c´ac biˆe.n ph´ap lo.c nhiˆ˜eu (Mu.c 3.1) v`a phˆan biˆe.t kh´a tˆo´t du.o c t´ınh liˆen tu.c th`o.i gian cu’a d`ong video v´o.i c´ac chuyˆe’n dˆo.ng cu’a camera v`a/ho˘a.c dˆo´i tu.o ng `en, nˆen su’ du.ng c´ac h`ınh chuyˆe’n da.ng k´eo th˘a’ng VNC Dˆe’ tiˆe.n so s´anh c´ac v` ung nˆ `en chuyˆe’n dˆo’i (k´ı hiˆe.u l`a VNCD); v`a n´o l`a `en k´eo th˘a’ng cu’a VNC du.o c go.i l`a v` ung nˆ V` ung nˆ `eu, nhu H`ınh mˆo.t ma’ng c´ac pixel hai chiˆ `en chuyˆe’n dˆo’i H`ınh V` ung nˆ 144 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN `an du a v`ao viˆe.c so s´anh `en, mˆo.t sˆo´ tru.`o.ng ho p cˆ Dˆe’ so s´anh nˆo.i dung hai v` ung nˆ ung phu o ng ph´ap Th´ap Gauss, quen thuˆo.c k˜ı trung b`ınh cu’a ch´ ung Ch´ ung tˆoi d˜a d` ’ `eu th`anh mˆo.t d˜ay c´ac pixel (k´ı hiˆe.u thuˆa.t n´en a’nh N´o cho ph´ep chuyˆe n mˆo.t VNCD hai chiˆ l`a dayPixel) v`a cuˆo´i c` ung s˜e chuyˆe’n th`anh mˆo.t pixel do.n (k´ı hiˆe.u l`a dPixel) Theo h`ınh 2, `an ´ap du.ng phu.o.ng ph´ap n`ay, v` ung rˆo.ng L*w s˜e du.o c chia th`anh c´ac cu’.a sˆo’; qua mˆo.t sˆo´ lˆ t´ınh du o c d˜ay c´ac pixel d˘a.c tru ng cho trung b`ınh m`au, dˆe’ t´ınh dPixel 2.2 Thuˆ a.t to´ an `au Thuˆa.t to´an su’ du.ng dayPixel v`a dPixel dˆe’ PRL thˆe’ hiˆe.n trˆen h`ınh Hai giai doa.n dˆ ’ ’ ’ ’ u ng tru `o ng ho p r˜o r`ang Chı n`ao khˆong thu `o ng du o c su du.ng dˆe kiˆe m tra nhanh cho nh˜ ph´at hiˆe.n du.o c m´o.i su’ du.ng dˆe´n giai doa.n Thuˆa.t to´an du.o c mˆo ta’ chi tiˆe´t nhu sau: Giai doa.n So s´anh pixel: Mˆo.t pixel mˆo˜i VNC du.o c so v´o.i pixel o’ c` ung vi tr´ı v`a mˆo.t `en kˆ `e n´o Nˆe´u tˆo’ng sˆo´ pixel hai VNC sˆo´ pixel lˆan cˆa.n (Vungp) VNC cu’a khung liˆ ´.ng kh´ac Khacp nho’ ho.n mˆo.t gi´a tri ngu.˜o.ng (Khacp < N guongp), hai khung tu.o.ng u ung mˆo.t lia v`a x´et t´o i khung tiˆe´p theo Ngu o c la.i, sang giai doa.n v´o i hai VNC coi nhu c` H`ınh Mˆo ta’ thuˆa.t to´an Giai doa.n So s´anh c´ac trung b`ınh m`au dPixel: Nˆe´u su kh´ac cu’a dPixel cu’a hai khung (go.i l`a Khacd) chu.a vu.o t qu´a ngu.˜o.ng (Khacd < N guongd), hai khung coi nhu c` ung mˆo.t lia v`a s˜e x´et t´o i khung tiˆe´p theo Ngu o c la.i, sang giai doa.n sau uy theo nˆo.i dung video C´ac ngu.˜o.ng N guongp v`a N guongd du.o c cho.n theo kinh nghiˆe.m; t` `e thˆong tin qua’ng c´ao, N guongp = 0, 15, N guongd = 0, 20 Ch˘a’ng ha.n xu’ l´ı d˜ u liˆe.u vˆ `an nˆ `en chung Giai doa.n So s´anh dayP ixel : T´ınh to´an xem hai khung chia se’ bao nhiˆeu phˆ `eu ngu o c la.i nhu trˆen h`ınh Mˆo˜i ung di theo chiˆ Hai dayP ixel du o c so s´anh b˘a` ng c´ach di.ch ch´ ’ bu ´o c di.ch l`a mˆo.t pixel v`a s˜e t´ınh du o c sˆo´ diˆe m kh´o p p tu.o.ng u ´.ng (sˆo´ c´ac gi´a tri kh´o.p liˆen tiˆe´p p cu’a dayP ixel cu’a khung i (dayP ixel i) v`a cu’a khung i − (dayP ixeli-1)) ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY ˆ DU CHUA NG 145 `au tiˆen, gi´a tri pixel dˆ `au tiˆen cu’a dayP ixeli du.o c so s´anh v´o.i gi´a tri V´ı du bu.´o.c di.ch dˆ pixel cuˆo´i m cu’a dayP ixeli-1 Giai doa.n n`ay kˆe´t th´ uc gi´a tri pixel cuˆo´i m cu’a dayP ixeli ` ´ du o c so v´o i gi´a tri pixel dˆau cu’a dayP ixeli-1 Nˆeu sˆo´ cu c da.i cu’a tˆa´t ca’ c´ac gi´a tri diˆe’m `eu rˆo.ng cu’a VNC (w ), hai khung coi nhu c` ung mˆo.t lia v`a s˜e x´et t´o.i kh´o.p (pmax) l´o.n ho.n chiˆ u.a hai khung khung tiˆe´p theo Ngu.o c la.i, d˜a ph´at hiˆe.n mˆo.t chuyˆe’n dˆo’i lia gi˜ `au tiˆen v`a cuˆo´i c` H`ınh Bu.´o.c di.ch dˆ ung cu’a dayPixel ˜ 2.3 Biˆ e.n ph´ ap lo.c nhiˆ eu Trong mˆo˜i khung video c´o thˆe’ `an trung tˆam nhˆa.n thˆa´y r˘`a ng c´ac phˆ cu’a VNC l`a rˆa´t nha.y v´o.i nhiˆ˜eu D˘a.c biˆe.t c´ac tru.`o.ng ho p ng˘a´t ca’nh v`ı su di chuyˆe’n cu’a dˆo´i tu.o ng v`ao VNC ho˘a.c dˆo.t ngˆo.t xuˆa´t hiˆe.n v`a `e k´ıch thu.´o.c (cˆa.n ca’nh) b`anh tru.´o.ng vˆ B˘`a ng viˆe.c cho.n t´ınh to´an thˆem c´ac v` ung g´oc cu’a VNC nhu trˆen H`ınh 5, s˜e c´o thˆem c´ac thˆong tin dˆe’ lo.c nhiˆ˜eu, gia’m du.o c phˆan doa.n sai Ngo`ai sˆo´ gi´a tri m`au trung b`ınh xˆa´p xı’ cu’a to`an bˆo VNCD l`a dP ixel , c`on t´ınh thˆem c´ac gi´a tri tu.o.ng u ´.ng cho g´oc tr´ai v`a g´oc pha’i (dP ixelT rai `en cu’a khung video H`ınh Lu a cho.n c´ac v` ung g´oc nˆ v`a dP ixelP hai) Trong thuˆa.t to´an d˜a tr`ınh b`ay (ii), bˆo’ sung thˆem Giai doa.n dˆe’ lo.c nhiˆ˜eu Sau d˜a thu c hiˆe.n xong Giai doa.n v`a ph´at hiˆe.n hai khung i v`a j c´o kha’ n˘ang l`a mˆo.t gianh gi´o.i gi˜ u.a hai lia D˘a.t KhacT rai v`a KhacP hai l`a c´ac su kh´ac cu’a hai gi´a tri dP ixelT rai v`a ung du.o c t´ınh nhu sau cu’a hai gi´a tri dP ixelP hai gi˜ u.a hai khung i v`a j Ch´ 100|dP ixelP haii − dP ixelP haij | KhacT rai = % (1) 2n d´o, n l`a sˆo´ bit m`au, o’ dˆay ta cho.n n = Tu.o.ng tu t´ınh du.o c KhacP hai T` u d´o x´ac di.nh du.o c gi´a tri kh´ac nho’ nhˆa´t KhacGoc 146 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN KhacGoc = min(KhacT rai, KhacP hai) (2) Nˆe´u KhacGoc l´o.n ho.n 10% gi´a tri kh´ac cu’a c´ac dP ixel c´o thˆe’ c´o, l´ uc n`ay thu c su u a hai khung i v`a j Ngu o c la.i, hai khung coi nhu n˘`a m c` ung xuˆa´t hiˆe.n mˆo.t gianh gi´o i lia gi˜ mˆo.t lia ˆ NG ˜ LIE ˆ U, XU’ LY ´ CHUYE ˆ’ N DO TINH CHI’NH DU ’ ´ ` ˆ CUA DOI TU O NG V A CAMERA ´t thuˆ 3.1 T´ om t˘ a a.t to´ an Hiˆe.n nay, k˜ y thuˆa.t ph´at hiˆe.n c˘a´t lia d˜a da.t du o c c´ac kˆe´t qua’ kh´a tˆo´t Ngu.o c la.i, k˜ y thuˆa.t ph´at hiˆe.n chuyˆe’n lia ph´ u.c `eu kh´o kh˘an ta.p vˆa˜n g˘a.p pha’i rˆa´t nhiˆ Nguyˆen nhˆan ch´ınh l`a kh´o c´o thˆe’ phˆan biˆe.t ch´ınh x´ac nh˜ u.ng thay dˆo’i nˆo.i dung `en kˆ `e chuyˆe’n h`ınh a’nh c´ac khung liˆ lia v`a chuyˆe’n dˆo.ng cu’a camera v`a c´ac `e ung tˆoi c˜ ung d˜a dˆ dˆo´i tu.o ng gˆay Ch´ ´ ´ ´ xuˆa t mˆo.t phu o ng ph´ap kh˘ac phu.c vˆa n `e chuyˆe’n dˆo.ng cu’a camera v`a dˆo´i tu.o ng dˆ ph´at hiˆe.n c´ac chuyˆe’n lia video ([3, 10]) Thuˆa.t to´an du a trˆen so s´anh c´ac d˘a.c `e t´ınh to`an cu.c c´o thˆe’ kh˘a´c phu.c vˆa´n dˆ chuyˆe’n dˆo.ng cu’a camera v`a dˆo´i tu.o ng, dˆo´i tu.o ng to`an cu.c ´ıt thay dˆo’i Dˆo´i v´o.i tru.`o.ng ho p hai lia c´o c´ac d˘a.c t´ınh to`an cu.c thˆe’ hiˆe.n c´ac thuˆo.c t´ınh giˆo´ng nhu.ng la.i c´o bˆo´ tr´ı khˆong gian kh´ac nhau, `an chia khˆo´i dˆe’ so s´anh c´ac d˘a.c t´ınh cˆ cu’a c´ac v` ung tu.o.ng u ´.ng c´ac khung u su kh´ac Phu o ng ph´ap n`ay loa.i tr` sinh bo’.i chuyˆe’n dˆo.ng tru.´o.c t´ınh to´an sai lˆe.ch gi˜ u.a hai khung Nhu vˆa.y su kh´ac n`ao d´o c`on la.i nˆo.i H`ınh C´ac bu.´o.c ph´at hiˆe.n c˘a´t lia dung h`ınh a’nh chı’ l`a mˆo.t c˘a´t lia gˆay nˆen Hai lia nˆo´i bo’.i mˆo.t chuyˆe’n lia c´o thˆe’ c´o phˆan bˆo´ m`au v`a/ho˘a.c bˆo´ tr´ı khˆong gian kh´ac Do d´o mˆo.t thay dˆo’i bˆo´ tr´ı cˆa´u tr´ uc cu’a mˆo.t a’nh thu.`o.ng biˆe’u thi su khˆong liˆen tu.c h`ınh a’nh C´ac d˘a.c t´ınh ca.nh pha’n `eu vˆ `e cˆa´u tr´ ´anh nhiˆ uc mˆo.t a’nh, ngh˜ıa l`a phˆan bˆo´ c´ac ca.nh hai khung n˘`a m o’ gianh gi´o i lia s˜e rˆa´t kh´ac Tu tu.o’.ng ch´ınh cu’a phu.o.ng ph´ap l`a su’ du.ng su tu.o.ng quan cu’a c´ac d˘a.c t´ınh ca.nh gi˜ u.a c´ac v` ung tu.o.ng u ´.ng dˆe’ su giˆo´ng nˆo.i dung h`ınh a’nh gi˜ u.a hai khung Phu o ng ph´ap du o c mˆo ta’ t´om t˘a´t nhu H`ınh V´o i mˆo˜i c˘a.p khung chuˆo˜i video, ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY ˆ DU CHUA NG 147 `eu Sau d´o su giˆo´ng khung th´ u nhˆa´t fn−1 du.o c chia th`anh c´ac khˆo´i b˘`a ng mˆo.t lu.´o.i dˆ gi˜ u a mˆo˜i c˘a.p khung b˘`a ng c´ach so s´anh c´ac d˘a.c t´ınh ca.nh mˆo˜i khˆo´i Bu.´o.c tiˆe´p theo l`a u.a hai khung dˆe’ b` u su kh´ac sinh bo’.i chuyˆe’n u.´o.c lu.o ng chuyˆe’n dˆo.ng cho mˆo˜i khˆo´i gi˜ dˆo.ng cu’a camera v`a dˆo´i tu o ng Nhu vˆa.y su kh´ac c`on la.i nˆo.i dung h`ınh a’nh cu’a c˘a.p khung s˜e chı’ l`a kˆe´t qua’ cu’a mˆo.t c˘a´t lia Mˆo˜i khˆo´i khung th´ u nhˆa´t s˜e l`am mˆa˜u dˆe’ t`ım c´ac khˆo´i kh´o.p v´o.i n´o ´.ng v´o.i n´o khung th´ u hai fn Vi tr´ı mˆo.t v` ung lˆan cˆa.n xung quanh khˆo´i tu.o.ng u u d´o t´ınh mˆo.t cu’a khˆo´i kh´o p nhˆa´t s˜e x´ac di.nh dˆo di.ch chuyˆe’n cu’a mˆo˜i khˆo´i gi˜ u a hai khung, t` u.a hai khˆo´i x´ac di.nh u chuyˆe’n dˆo.ng Su’ du.ng mˆo.t h`am dˆo kh´o.p gi˜ sˆo´ su giˆo´ng dˆe’ b` u.a ch´ ung Gi´a tri hˆe sˆo´ tu.o.ng quan l´o.n nhˆa´t du.o c su’ du.ng l`am sˆo´ hˆe sˆo´ tu.o.ng quan gi˜ `e c` kh´o p cˆo´ di.nh v´o i mˆo˜i khˆo´i Hai khung thuˆo.c vˆ ung mˆo.t lia phˆan bˆo´ khˆong gian cu’a c´ac d˘a.c ´ ´ t´ınh ca.nh s˜e giˆong v`a kh´o p cˆo di.nh v´o i da sˆo´ c´ac khˆo´i l´o.n s˜e biˆe’u thi mˆo.t kh´o.p tˆo´t `an l´o.n c´ac kh´o.p khˆong tˆo´t s˜e cho thˆa´y phˆan bˆo´ khˆong gian cu’a c´ac d˘a.c t´ınh ca.nh bi Nˆe´u phˆ thay dˆo’i, biˆe’u hiˆe.n s˜e c´o mˆo.t c˘a´t lia Kˆe´t ho p sˆo´ kh´o.p cˆo´ di.nh cu’a tˆa´t ca’ c´ac khˆo´i s˜e cho ung l`a su’ du.ng sˆo´ giˆo´ng mˆo.t sˆo´ su giˆo´ng cho mˆo˜i c˘a.p khung Bu.´o.c cuˆo´i c` n`ay dˆe’ quyˆe´t di.nh su xuˆa´t hiˆe.n cu’a mˆo.t c˘a´t lia ` 3.2 Chia khˆ o´i cho c´ ac khung nh˘ a m b` u chuyˆ e’n dˆ o.ng `au tiˆen phu o ng ph´ap l`a u ´o c lu o ng chuyˆe’n dˆo.ng cho mˆo˜i khˆo´i gi˜ Bu ´o c dˆ u.a hai khung dˆe’ loa.i tr` u su kh´ac sinh bo’.i c´ac chuyˆe’n dˆo.ng Gia’ thiˆe´t r˘`a ng khung a’nh gˆo`m c´ac u khˆo´i di.ch chuyˆe’n v`a chuyˆe’n dˆo.ng mˆo˜i khˆo´i pixel l`a khˆong thay dˆo’i Theo d´o khˆo´i th´ i l`a xi (ξ) khung fn−1 du.o c l`am mˆa˜u nhu l`a mˆo.t phiˆen ba’n du.o c di.ch di cu’a mˆo.t khˆo´i c` ung k´ıch thu.´o.c xj (ξ) khung fn nhu sau xi (ξ) = xj (ξ + d) (3) d´o ξ l`a vecto to.a dˆo khˆong gian v`a d l`a vecto di.ch chuyˆe’n x´ac di.nh nh`o t`ım vi tr´ı cu’a ´.ng khung fn Gia’ su’ xi du.o c biˆe’u diˆ˜en du.´o.i khˆo´i kh´o.p nhˆa´t lˆan cˆa.n khˆo´i tu.o.ng u da.ng mˆo.t ma trˆa.n c´ac diˆe’m a’nh khˆong gian r`o.i ra.c 2-D, th`ı c´ac vecto to.a dˆo khˆong gian ξ v`a c´ac vecto di.ch chuyˆe’n d c´o thˆe’ du.o c biˆe’u diˆ˜en du.´o.i da.ng c´ac ma trˆa.n cˆo.t y theo tiˆeu chuˆa’n kh´o.p v`a phu.o.ng ph´ap m˘a.t ph˘a’ng xy C´ac thuˆa.t to´an kh´o.p khˆo´i biˆe´n dˆo’i tu` t`ım kiˆe´m Do.n gia’n nhˆa´t l`a phu.o.ng ph´ap su giˆo´ng gi˜ u.a c´ac mˆa˜u m´ u.c x´am ch´ u.a xi (ξ) v´o.i mˆo.t khˆo´i c´o kha’ n˘ang kh´o.p nhˆa´t fn ([1]) C´ac phu.o.ng ph´ap thu.`o.ng t´ınh tˆo’ng sai lˆe.ch tuyˆe.t dˆo´i ho˘a.c tˆo’ng sai lˆe.ch b`ınh phu.o.ng Du a v`ao xi (ξ) v`a yj (ξ), o’ dˆay yj (ξ) l`a mˆo.t ´.ng khung fn , tu.o.ng quan cu’a hai h`am 2-D du.o c di.nh ngh˜ıa khˆo´i lˆan cˆa.n khˆo´i tu.o.ng u ρ(ζ) = (xi × yj )(ζ) = xi (ξ + ζ)yj (ξ) (4) ξ d´o ζ l`a c´ac vecto di.ch chuyˆe’n thay dˆo’i qu´a tr`ınh t´ınh h`am tu.o.ng quan cho hai ´.ng v´o.i mˆo˜i dˆo di.ch r`o.i ra.c c´o kha’ n˘ang ζ s˜e c´o mˆo.t gi´a khˆo´i diˆe’m a’nh V`ı l`a a’nh sˆo´, cho nˆen u u c dˆo kh´o p, ´ap du.ng su di.ch chuyˆe’n tu.o.ng u ´.ng ζ t´o.i v` ung xi tri giˆo´ng ty’ lˆe v´o i m´ ’ ` ´ ´ N´oi c´ach kh´ac, b˘a ng viˆe.c t´ınh ρ(ζ) trˆen tˆa t ca’ c´ac di.ch chuyˆe n c´o kha’ n˘ang (tˆa t ca’ c´ac v´ı du `an ung tu.o.ng quan da.t gi´a tri dı’nh nguyˆen, ta.i di.ch chuyˆe’n gˆ o’ dˆay xi v`a yj che lˆa´p nhau), v` ’ nhˆa´t v´o i di.ch chuyˆe n d´ ung cu’a xi gi˜ u a fn−1 v`a fn N´oi c´ach kh´ac, nˆe´u cˆong th´ u c (3) luˆon thoa’ m˜an cho v` ung xi th`ı ρ(ζ) c´o gi´a tri dı’nh cu’a n´o ta.i ζ = d v`a dˆo di.ch d˜a du.o c x´ac di.nh 148 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN Tuy nhiˆen, su’ du.ng cˆong th´ u.c (4) dˆe’ u.´o.c lu.o ng chuyˆe’n dˆo.ng s˜e g˘a.p mˆo.t sˆo´ bˆa´t tiˆe.n nhu da’i cu’a ρ(ζ) phu thuˆo.c v`ao k´ıch thu.´o.c xi v`a n´o khˆong pha’i luˆon l`a h˘`a ng sˆo´ to`an bˆo chuˆo˜i a’nh ([5]) Dˆe’ kh˘a´c phu.c du.o c nhu.o c diˆe’m trˆen su’ du.ng tu.o.ng quan ch´eo tiˆeu chuˆa’n h´oa , di.nh ngh˜ıa nhu sau ξ (xi(ξ + ζ) − xi (ξ))(yj (ξ) − y j (ζ)) (5) γ(ζ) = [ ξ (xi (ξ + ζ) − xi (ξ))2 ξ (yj (ξ) − y j (ζ))2 ]1/2 ung che lˆa´p bˆen d´o xi (ξ) l`a trung b`ınh cu’a khˆo´i xi v`a y j (ζ) l`a trung b`ınh cu’a yj v` ’ ´ ’ du ´o i xi Ph´ep thˆong kˆe n`ay c´o d˘a.c diˆe m l`a n´o tu o ng quan trˆen ty lˆe chia tuyˆe.t dˆo´i v`a chı’ thi mˆo.t c´ach tuyˆe´n t´ınh su giˆo´ng gi˜ u.a c´ac khˆo´i Sau d´o gi´a tri cu’a hˆe sˆo´ tu.o.ng quan u.a, nh`o tiˆeu chuˆa’n h´oa h`am tu.o.ng l´o.n nhˆa´t du.o c su’ du.ng l`am sˆo´ dˆo kh´o.p cˆo´ di.nh Ho.n n˜ quan ch´eo, ph´ep tro’ nˆen bˆa´t biˆe´n tru ´o c thay dˆo’i cu’a dˆo l´o.n k´ıch thu.´o.c a’nh ([4]) `en khˆong gian tu.o.ng Tuy nhiˆen, viˆe.c t´ınh to´an tu.o.ng quan du.o c tiˆeu chuˆa’n h´oa miˆ dˆo´i kh´o kh˘an, tr` u c´ac v` ung l`a nho’ Gia’ su’ r˘`a ng xi v`a yj l`a c´ac v` ung vuˆong c´o k´ıch thu.´o.c u.a hai v` ung N × N v`a M × M , thˆong thu.`o.ng N ≤ M, tu.o.ng quan du.o c tiˆeu chuˆa’n h´oa gi˜ `en tˆ `an sˆo´ N tiˆe´n gˆ `an M v`a v´o.i N v`a M l´o.n ho.n c´o thˆe’ du.o c t´ınh hiˆe.u qua’ ho.n miˆ `en tˆ `an sˆo´ du.o c di.nh ngh˜ıa nhu sau ([3, 4]) Tu.o.ng quan du.o c tiˆeu chuˆa’n h´oa miˆ −1 {x (ω)ˆ yj∗(ω)} i ρ(ξ) = (6) |xi (ω)|2dω |ˆ yi (ω)|2dω `an sˆo´ khˆong gian, xi (ω) biˆe’u thi d´o ξ v`a ω l`a c´ac vecto to.a dˆo khˆong gian v`a to.a dˆo tˆ −1 ’ ’ ´ ´ ’ u.c V`ı l´ y biˆe u thi h`am Fourier ngu.o c v`a l`a liˆen ho p ph´ biˆen dˆo i Fourier cua khˆoi xi (ξ), dˆe’ gia’m sai sˆo´, v´o i mˆo.t khˆo´i k´ıch thu ´o c M da’i cu’a u ´o c lu o ng l`a [−M/2 + 1, M/2] Thˆa.m ch´ı, v´o.i mˆo.t khˆo´i c´o ca.nh M , chı’ c´o u.´o.c lu.o ng bˆen da’i [−M/4 + 1, M/4] du.o c quan ung quan tˆam xi c´o ca.nh N × N u.a v` tˆam dˆe´n Phu.o.ng ph´ap u.´o.c lu.o ng chuyˆe’n dˆo.ng gi˜ ung tu o ng u ´ ng khung nhu sau khung v´o i mˆo.t v` T´ach c´ac khˆo´i xi v`a xj ca’ hai c´o k´ıch thu.´o.c M × M d´o M = 2N u.c (6) Thu c hiˆe.n tu.o.ng quan tiˆeu chuˆa’n h´oa su’ du.ng cˆong th´ Chı’ t`ım dı’nh tu.o.ng quan bˆen u.´o.c lu.o ng di.ch chˆo˜ [−N/2 + 1, N/2] ` a.c t´ınh ca.nh v` a biˆ e’u dˆ o` m` au nh˘ a m t˘ ang dˆ o tin cˆ a.y 3.3 Kˆ e´t ho p su’ du.ng c´ ac d˘ Qu´a tr`ınh kh´o.p khˆo´i du a trˆen gia’ thiˆe´t phˆan bˆo´ c´ac d˘a.c t´ınh ca.nh thay dˆo’i mˆo.t `an pha’i t´ınh dˆe´n tu.o.ng quan cu’a c´ac d˘a.c t´ınh ca.nh gi˜ u.a hai a’nh (su’ du.ng chuyˆe’n lia Do d´o cˆ u c x´am ch´ u a mˆo˜i khˆo´i l`a khˆong du’ ch´ınh x´ac) V`ı d˘a.c t´ınh ca.nh tu o ng quan v´o i mˆa˜u m´ `an sˆo´ cao, d´o s˜e su’ du.ng mˆo.t bˆo lo.c thˆong cao cho mˆo˜i a’nh tru.´o.c miˆeu ta’ hiˆe.n tu o ng a’nh tˆ ung tu.o.ng quan nhˆa.n du.o c t` u c´ac v` ung thˆong cao s˜e ch´ u.a thu c hiˆe.n tu.o.ng quan Mˆo.t v` `eu dı’nh c´o thˆe’ t`ım thˆa´y ho n, ngu o c la.i nh˜ u ng v` ung tu o ng quan nhˆa.n du o c t` u nh˜ u ng v` ung nhiˆ ’ ˜ ´ ` ´ ´ ’ thˆong thˆa p s˜e cho mˆo.t miˆen tu o ng quan ph˘ang dˆe gˆay nˆen sai sˆo Kˆet qua c´o du o c ´ap du.ng bˆo lo.c thˆong cao l`a trung b`ınh cu.c bˆo cu’a cu.`o.ng dˆo a’nh du.o c loa.i bo’, ngh˜ıa l`a tu.o.ng quan gi˜ u.a c´ac khˆo´i l`a bˆa´t biˆe´n tru.´o.c biˆe´n dˆo’i cu.`o.ng dˆo trung b`ınh Nˆe´u chı’ d` ung ph´ep giˆo´ng du a trˆen tu.o.ng quan c´ac d˘a.c t´ınh ca.nh, ca’ v´o.i k´ıch thu.´o.c c´ac khˆo´i biˆe´n dˆo’i th´ıch nghi, c˜ ung khˆong du’ pha’n ´anh hˆe´t c´ac thay dˆo’i nˆo.i dung h`ınh a’nh khung video V´ı du tru.`o.ng ho p c´ac khung video c´o cˆa´u tr´ uc do.n gia’n, ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY ˆ DU CHUA NG 149 `eu dˆo´i tu.o ng di chuyˆe’n ho˘a.c c´ac chuyˆe’n dˆo.ng qu´a ph´ `eu dˆa˜n dˆe´n khung c´o nhiˆ u.c ta.p dˆ `an su’ du.ng kˆe´t ho p v´o i so s´anh phˆan bˆo´ m`au dˆe’ t˘ang dˆo ch´ınh x´ac tu o ng quan k´em Do d´o cˆ ´ ph´at hiˆe.n c˘at lia Hai lia c´o thˆe’ c´o phˆan bˆo´ m`au kh´ac ho˘a.c giˆo´ng nhu.ng cˆa´u tr´ uc khˆong gian ’ `an so s´anh dˆe ph´at hiˆe.n c˘a´t lia l`a (i) phˆan bˆo´ kh´ac R˜o r`ang hai d˘a.c tru ng quan tro.ng cˆ m`au v`a (ii) cˆa´u tr´ uc bˆen Do d´o, thuˆa.t to´an ph´at hiˆe.n c˘a´t lia nˆeu trˆen du.o c mo’ rˆo.ng ung tu.o.ng u ´.ng (chia khˆo´i) Trong d´o, mˆo˜i kˆe´t ho p v´o.i so s´anh c´ac phˆan bˆo´ m`au cu’a c´ac v` u chuyˆe’n dˆo.ng tru.´o.c so s´anh biˆe’u dˆo` m`au cu’a c´ac v` ´.ng N´oi c´ach ung tu.o.ng u khˆo´i du.o c b` kh´ac, biˆe’u dˆo` m`au cu’a mˆo˜i khˆo´i khung fn−1 du o c so s´anh v´o i biˆe’u dˆo` cu’a khˆo´i kh´o.p nhˆa´t khung fn Kˆe´t ho p so s´anh biˆe’u dˆo` m`au v´o.i so s´anh c´ac d˘a.c tru.ng ca.nh s˜e cho `an l`a: ´.ng v´o.i v´o.i mˆo˜i c˘a.p khung, d´o c´o hai th`anh phˆ mˆo.t vecto giˆo´ng u ’ ´ ´ ´ u chuyˆe n dˆo.ng cu’a phˆan bˆo c´ac d˘a.c tru ng ca.nh mˆo˜i khung Sˆo giˆong d˜a b` Sˆo´ kh´ac d˜a b` u chuyˆe’n dˆo.ng cu’a phˆan bˆo´ m`au mˆo˜i khung `e cu’a c` y tu.o’.ng l`a c´ac khung liˆe´n kˆ ung mˆo.t lia s˜e c´o Viˆe.c kˆe´t ho p n`ay du a trˆen gia’ thiˆe´t l´ ´ ´ ´ cˆa u tr´ uc khˆong gian v`a phˆan bˆo m`au giˆong nhau, ngu o c la.i, hai khung t´ach biˆe.t bo’.i mˆo.t c˘a´t lia pha’i c´o ca.nh v`a phˆan bˆo´ m`au kh´ac Su’ du.ng kˆe´t ho p hai phu.o.ng ph´ap c´o u.u diˆe’m l`a mˆo.t ph´ep chı’ thi kha’ n˘ang c´o mˆo.t c˘a´t lia, th`ı ph´ep kh´ac s˜e du.o c d` ung dˆe’ x´ac minh la.i ’ NANG ˆ U VIDEO ˜ LIE ˆ ˘ ˆ DOAN DU NANG CAO KHA PHAN `au phˆ 4.1 Nhu cˆ an doa.n `eu thu c hiˆe.n so s´anh o’ m´ C´ac thuˆa.t to´an phˆan doa.n video hiˆe.n dˆ u.c khung gi˜ u.a c´ac `en kˆ `e v`a cho c´ac kˆe´t qua’ chˆa´p nhˆa.n du.o c Ch´ ung qu´et to`an bˆo d`ong video v`a xu’ l´ y khung liˆ ung c´ac khung theo tr`ınh tu tuyˆe´n t´ınh Do t´ınh tu o ng quan cao cu’a c´ac khung video c` ´ ` ` ´ mˆo.t lia, cho nˆen tru `o ng ho p n`ay rˆa t nhiˆeu ph´ep so s´anh thu c su khˆong cˆan thiˆet, l`am `eu kh´o kh˘an, nhˆa´t l`a cho c´ac thuˆa.t to´an ph´ u.c ta.p ho.n v`a kha’ n˘ang thu c hiˆe.n g˘a.p nhiˆ ´ `e xuˆa´t phu.o.ng u nhˆa.n x´et d´o, ch´ ung tˆoi dˆ tru `o ng ho p k´ıch thu ´o c video l´o n ([7]) Xuˆa t ph´at t` y thuˆa.t u liˆe.u video b˘`a ng c´ach ´ap du.ng c´ac k˜ ph´ap nh˘`a m ca’i tiˆe´n c´ac thuˆa.t to´an phˆan doa.n d˜ ’ ´ ` ´ ´ ng Thu c chˆa t l`a nh`o d´o, c´o thˆe bo’ qua viˆe.c so s´anh mˆo.t sˆo khung nha’y dˆeu v`a nha’y th´ıch u ung mˆo.t lia m`a khˆong so sai s´ot ch´ ung o’ c` H`ınh Minh ho.a phu.o.ng ph´ap so s´anh khˆong tuyˆe´n t´ınh 150 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN Chuˆo˜i video mˆa˜u d` ung dˆe’ phˆan t´ıch nhu trˆen H`ınh 7a Gia’ su’ chuˆo˜i video n`ay gˆo`m 50 u.a c´ac khung k17 v`a k18 v`a chuyˆe’n lia khung v`a c´o lia Gianh gi´o.i cu’a lia v`a lia n˘`a m gi˜ u.a c´ac khung k31 v`a k32 v`a chuyˆe’n n`ay l`a mˆo.t chˆo`ng m`o.; gianh gi´o.i cu’a lia v`a lia n˘`a m gi˜ u liˆe.u video tru.´o.c dˆay thu c hiˆe.n c´ac ph´ep lia n`ay l`a mˆo.t c˘a´t lia C´ac k˜ y thuˆa.t phˆan doa.n d˜ `en kˆ `e, nˆe´u ch´ so s´anh su kh´ac gi˜ u.a c´ac khung liˆ ung su’ du.ng c´ac thuˆa.t to´an tuyˆe´n t´ınh, `an lu o t to`an bˆo c´ac khung nhu mˆo ta’ trˆen H`ınh 7b ch´ ung s˜e qu´et lˆ `eu 4.2 K˜ y thuˆ a.t nha’y dˆ `eu khˆong thu c hiˆe.n c´ac ph´ep so y thuˆa.t nha’y dˆ Khˆong nhu c´ac thuˆa.t to´an tuyˆe´n t´ınh, k˜ `en kˆ `e m`a thu c hiˆe.n so s´anh c´ach dˆ `eu mˆo.t sˆo´ khung Mˆo˜i ph´ep so s´anh s´anh gi˜ u.a c´ac khung liˆ `eu d khung (bu ´o c nha’y d) Th´ı du tru.`o.ng ho p d = nhu trˆen H`ınh s˜e du o c thu c hiˆe.n c´ach dˆ 7c C´ac ph´ep so s´anh thu c hiˆe.n gi˜ u.a c´ac khung sau k1 v´o.i k1+d (k3), k3 v´o.i k3+d (k5), k5 v´o.i k5+d (k7), Qu´a tr`ınh so s´anh c´ u tiˆe´p tu.c nhu vˆa.y Khi ph´at hiˆe.n hai khung ki v`a ki+2 n˘`a m hai lia kh´ac nhau, s˜e tiˆe´n h`anh so s´anh khung ki v´o.i ki+1 dˆe’ x´ac di.nh gianh gi´o.i c´ac lia Nˆe´u khung ki v`a ki+1 n˘`a m hai lia kh´ac nhau, th`ı gianh gi´o.i lia n˘`a m gi˜ u.a hai khung ki v`a ki+1 Ngu.o c la.i, nˆe´u khung ki v`a ki+1 n˘`a m c` ung mˆo.t lia, th`ı ch˘a´c ch˘a´n u a hai khung v`a ki+1 v`a ki+2 gianh gi´o i lia n˘`a m gi˜ ˜ Tru `o ng ho p mˆoi lia c´o tˆo´i thiˆe’u khung s˜e khˆong `an so s´anh hai khung ki+1 v´o.i ki+2 Khi d˜a x´ac cˆ di.nh du.o c gianh gi´o.i lia, tr`ınh tu du.o c l˘a.p la.i cho y thuˆa.t nha’y lia tiˆe´p theo Lu.u dˆo` thuˆa.t to´an cu’a k˜ `eu du o c thˆe’ hiˆe.n trˆen H`ınh Ch´ u y´ ph´ep dˆ uc vˆa˜n d˘a.t la.i sˆo´ th´ u tu khung l`a kiˆe’m tra dˆe’ kˆe´t th´ i := i + d, v`ı sau v`ong l˘a.p so s´anh gi˜ u.a c´ac khung ki v`a ki+1 , sˆo´ dˆe´m i t˘ang lˆen do.n vi th`ı ngu.o c la.i sˆo´ dˆe´m d la.i gia’m do.n vi `eu c´o thˆe’ cho ph´ep gia’m gˆ `an K˜ y thuˆa.t nha’y dˆ mˆo.t nu’ a (v´o i d = 2) sˆo´ ph´ep so s´anh so v´o i chı’ su’ du.ng c´ac thuˆa.t to´an tuyˆe´n t´ınh C´o thˆe’ tˆo’ng qu´at h´oa tru.`o.ng ho p bu.´o.c nha’y d l´o.n ho.n dˆe’ cho kˆe´t qua’ tˆo´t ho.n Sˆo´ ph´ep so s´anh cu’a qu´a tr`ınh y cu’a phˆan doa.n luˆon bi gi´o.i ha.n bo’.i kha’ n˘ang xu’ l´ m´ay t´ınh V´o i c´ac m´ay t´ınh c´o tˆo´c dˆo khˆong cao y´ ngh˜ıa cu’a k˜ y thuˆa.t n`ay c`ang thˆe’ hiˆe.n r˜o `eu 4.3 K˜ y thuˆ a.t nha’y dˆ o.ng H`ınh Lu.u dˆo` thuˆa.t to´an nha’y dˆ y thuˆa.t nha’y Gi´a tri bu.´o.c nha’y d n´oi trˆen luˆon phu thuˆo.c v`ao c´ac d`ong video Trong k˜ ´.ng dˆe’ da’m th´ıch u ´.ng (nha’y dˆo.ng), gi´a tri d du.o c x´ac di.nh dˆo.ng, biˆe´n dˆo’i mˆo.t c´ach th´ıch u `an l˘a.p, thuˆa.t to´an t´ınh la.i bu.´o.c nha’y d cho th´ıch ho p, b˘`a ng c´ach so s´anh ba’o l`a tˆo´i u.u Mˆo˜i lˆ khung hiˆe.n ta.i v´o i khung v` u.a du.o c kiˆe’m tra nhu trˆen H`ınh 7d ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY ˆ DU CHUA NG 151 `eu ho.n ph´ep so s´anh tru.´o.c, o’ ph´ep so s´anh Nˆe´u su giˆo´ng cu’a ph´ep so s´anh n`ay nhiˆ kˆe´ tiˆe´p, gi´a tri d s˜e du o c t˘ang lˆen v`a ngu o c la.i M˘a.t kh´ac nˆe´u ph´ep so s´anh hiˆe.n ta.i cho biˆe´t `an su’ du.ng c´ac ui dˆ khung n˘`a m o’ lia kh´ac nhau, s˜e quay la.i thu c hiˆe.n theo xu hu.´o.ng l` `eu bu ´o c nha’y dˆ Khi ph´at hiˆe.n ch´ınh x´ac gianh gi´o.i lia, s˜e tro’ la.i tiˆe´n tr`ınh nha’y dˆo.ng thuˆa.n b`ınh thu.`o.ng ´.ng cho c´ac kˆe´t qua’ kh´a tˆo´t K˜ y thuˆa.t nha’y dˆo.ng su’ du.ng bu.´o.c nha’y th´ıch u ˆ´T LUA ˆN KE B`ai b´ao d˜a gi´o.i thiˆe.u viˆe.c chuˆa’n bi d˜ u liˆe.u xˆay du ng c´ac hˆe CSDL video sˆo´ Mˆo.t `eu nh˘`a m mu.c d´ıch phˆan doa.n d˜ u liˆe.u video mˆo.t c´ach ch´ınh x´ac v`a hiˆe.u qua’ sˆo´ gia’i ph´ap dˆ ´ ng du.ng chuˆa’n bi d˜ u liˆe.u video tˆo’ ch´ u.c c´ac CSDL video Phu o ng ph´ap n`ay d˜a du o c u hˆe thˆo´ng camera quan s´at an ninh `en v`a c´ac ung nˆ Thuˆa.t to´an ph´at hiˆe.n c˘a´t lia cho thˆa´y r˜o hiˆe.u qua’, v`ı d˘a.c diˆe’m cu’a c´ac v` ’ ˜ u hˆe thˆo´ng n`ay l`a dˆe nhˆa.n diˆe.n D˘a.c biˆe.t thuˆa.t da.ng chuyˆe n dˆo.ng video nhˆa.n du o c t` u liˆe.u video to´an nha’y dˆo.ng cho ph´ep ca’i thiˆe.n d´ang kˆe’ kha’ n˘ang phˆan doa.n d˜ ’O ` LIE ˆ U THAM KHA TAI [1] A Giachetti, Matching techniques to compute image motion, Image and Vision Computing 18 (3) (2000) 247–260 `e xu’ l´ y d˜ u liˆe.u [2] Dˆo˜ Trung Tuˆa´n, Lu.o.ng Xuˆan Cu.o.ng, Khun Piseth, Nguyˆ˜en V˘an Ta’o, Vˆ `e cho.n `an th´u VI: Mˆ o.t sˆo´ vˆ a´n dˆ video, To`an v˘an c´ac b´ao c´ao khoa ho.c, Hˆ o.i tha’o Quˆ o´c gia lˆ ` lo.c cu’a cˆ ong nghˆe thˆ ong tin v` a truyˆen thˆ ong, Th´ai Nguyˆen, NXB Khoa ho.c K˜ y thuˆa.t, th´ang 8, 2003 (454–459) [3] E Saez et al, Combining luminescence and edge based metrics for robust temporal video segmentation, IEEE Int’ l Conf on Image Processing (ICIP2004), Singapore, Oct 24 27, 2004 (126–132) [4] H Yu, W Wolf, A visual search system for video and image databases, Proc IEEE Int’l Conf on Multimedia Computing and Systems, Ottawa - Canada, Jun., 1997 (517–524) [5] J P Lewis, Fast normalized cross-correlation, Vision Interface (1995), trang 120–123, http://www.idiom.com/ zilla/Work/nvisionInterface/nip.html [6] JungHwan Oh Kien et al, A content-based scene change detection and classification technique using background tracking, SPIE Conf on Multimedia Computing and Networking 2000, San Jose, CA, Jan., 2000 (233–245) [7] JungHwan Oh Kien et al, “Efficient and cost-effective techniques for browsing and indexing large video databases, computer science program”, School of EECS University of Central Florida, Orlando, (2001) (2328–2362) [8] Lu.o.ng Ma.nh B´a, Nguyˆ˜en Thanh Thuy’, Nhˆ a.p mˆ on xu’ l´y a’nh sˆo´, NXB Khoa ho.c K˜ y thuˆa.t, H`a Nˆo.i, 1998 [9] Lu.o.ng Xuˆan Cu.o.ng, Dˆo˜ Trung Tuˆa´n, Thuˆa.t to´an cho ph´ep nˆang cao kha’ n˘ang phˆan doa.n d˜ u liˆe.u video, Ta.p ch´ı khoa ho.c - Chuyˆen san Khoa ho.c Tu nhiˆen v` a Cˆ ong nghˆe , Da.i ho.c Quˆo´c gia H`a Nˆo.i, XXII (3) (2006) 13–24 152 ˜ TRUNG TUA ˜ XUAN ˆ ˆ´N, DO ˆ ˆ TIE ˆ´N ˆ CU.O.NG, DO LU O NG XUAN [10] Lu.o.ng Xuˆan Cu.o.ng, Dˆo˜ Xuˆan Tiˆe´n, Dˆo˜ Trung Tuˆa´n, Mˆo.t k˜ y thuˆa.t chı’ sˆo´ h´oa tu dˆo.ng `en, Ta.p ch´ı khoa ho.c - Khoa ho.c Tu nhiˆen v` a ung nˆ d˜ u liˆe.u video du a trˆen d´anh dˆa´u v` ´ Cˆ ong nghˆe., Da.i ho.c Quˆoc gia H`a Nˆo.i, XXII (2) (2006) 1–11 [11] Lu.o.ng Xuˆan Cu.o.ng, Dˆo˜ Xuˆan Tiˆe´n, Dˆo˜ Trung Tuˆa´n, Phu.o.ng ph´ap ph´at hiˆe.n c´ac chuyˆe’n lia ph´ u.c ta.p du a trˆen u.´o.c lu.o ng chuyˆe’n dˆo.ng c´ac khung video, Ta.p ch´ı Chuyˆen ong v` a cˆ ong nghˆe thˆ ong tin (17) (12 san C´ ac cˆ ong tr`ınh nghiˆen c´u.u - triˆe’n khai viˆe˜n thˆ 2006) 15–25 [12] S V Porter et al, Temporal video segmentation and classification of edit effects, Image and Vision Computing 21 (2003) 1097–1106 Nhˆ a.n b` ng` ay 26 - - 2007 ay 23 - -2007 Nhˆ a.n la.i sau su’ a ng` ... liˆe.u video c´o thˆe chia th`anh nhiˆ video dˆe’ so s´anh, (ii) c´ac phu o ng ph´ap so s´anh, (iii) dˆo´i tu.o ng video thu c hiˆe.n phˆan doa.n C´ac k˜ y thuˆa.t phˆan doa.n d˜ u liˆe.u video. .. doa.n d˜ u liˆe.u video theo th`o.i gian nh˘`a m mu.c d´ıch phˆan chia d`ong video liˆen tu.c th`anh c´ac n vi co so’ c´o y´ ngh˜ıa l`a c´ac lia (shot) ho˘a.c c´ac ca’nh (scene) Trong d´o, lia... mˆo.t chuˆo˜i video Trong d´o vˆa´n dˆ `an biˆe’u thi d˘a.c t´ınh (c´ac d˘a.c t´ınh) dˆe’ biˆe’u diˆ˜en nˆo.i dung h`ınh a’nh D˘a.c t´ınh du.o c cho.n cˆ ˆ’ N BI DU ˜ LIE ˆ U TRONG VIE ˆ C XAY

Ngày đăng: 10/06/2017, 17:15

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan