Thông tin tài liệu
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
NGUYỄN VĂN CĂN
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT
TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN
TỪ DỮ LIỆU VIDEO GIAO THÔNG
LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI, NĂM 2015
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
NGUYỄN VĂN CĂN
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT
TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN
TỪ DỮ LIỆU VIDEO GIAO THÔNG
Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC
Mã số: 62 46 01 10
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
1. PGS. TS. NGUYỄN ĐỨC HIẾU
Học viện Kỹ thuật Quân sự
2. TS. PHẠM VIỆT TRUNG
Cục Công nghệ thông tin – Bộ Quốc phòng
HÀ NỘI, NĂM 2015
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Những
nội dung, số liệu và kết quả trình bày trong luận án là hoàn toàn trung thực
và chưa có tác giả nào công bố trong bất cứ một công trình nào khác.
Tác giả luận án
Nguyễn Văn Căn
LỜI CẢM ƠN
Trước hết tôi xin bày tỏ lòng biết ơn chân thành của tôi với tập thể giáo
viên hướng dẫn của tôi, PGS. TS Nguyễn Đức Hiếu, Giám đốc Trung tâm Công
nghệ thông tin, Học viện Kỹ thuật Quân sự Việt Nam; TS. Phạm Việt Trung,
Phó cục trưởng Cục Công nghệ thông tin - Bộ Quốc phòng trực tiếp hướng dẫn
cho tôi thông qua sự tiến bộ nghiên cứu.
Tôi muốn cảm ơn tất cả các giảng viên mà tôi đã có vinh dự được cùng
làm việc hoặc tham gia các khóa học trong quá trình làm nghiên cứu sinh. Cảm
ơn các thầy giáo, cô giáo Viện Công nghệ thông tin, phòng Quản lý đào tạo sau
đại học thuộc Viện Khoa học và Công nghệ quân sự - Bộ quốc phòng.
Tôi muốn đặc biệt cảm ơn PGS. TS Ngô Quốc Tạo, TS. Nguyễn Đức
Dũng, phòng Nhận dạng và Xử lý tri thức, thuộc Viện Công nghệ thông tin,
Viện hàn lâm Khoa học Việt Nam; cảm ơn các đồng nghiệp công tác tại Trường
Đại học Kỹ thuật – Hậu cần Công an nhân dân đã có những bàn luận, thảo luận
hữu ích, cài đặt thử nghiệm trong công việc nghiên cứu của tôi.
Cuối cùng, tôi dành luận án này cho gia đình tôi và bạn bè của tôi. Nếu
không có sự hỗ trợ của họ đầy đủ, tôi sẽ không có can đảm để đi qua tất cả
những khó khăn trong việc nghiên cứu.
i
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU ................................................................................................... iii
DANH MỤC CHỮ VIẾT TẮT ................................................................................................. iv
DANH MỤC CÁC BẢNG ......................................................................................................... v
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................................... vi
MỞ ĐẦU ............................................................................................................... 1
Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG
TIỆN GIAO THÔNG TỪ VIDEO ........................................................................ 8
1.1. Cơ sở lý thuyết và những khái niệm cơ bản ........................................... 8
1.1.1. Dữ liệu video số ............................................................................... 8
1.1.2. Mô-men bất biến ............................................................................ 12
1.1.3. Hình dạng và Khối đối tượng chuyển động ................................... 13
1.1.4. Đường viền đối tượng .................................................................... 13
1.1.5. Nền và đối tượng chuyển động ...................................................... 21
1.1.6. Entropy của khối ............................................................................ 22
1.1.7. Biểu diễn hình dạng đối tượng theo vector khoảng cách .............. 25
1.2. Một số phương pháp và công trình nghiên cứu liên quan .................... 29
1.2.1. Hệ thống điều khiển giao thông và giám sát an ninh ..................... 30
1.2.2. Hệ thống phát hiện và phân loại xe dựa trên video ....................... 32
1.2.3. Hệ thống giám sát giao thông dựa trên độ dài ............................... 34
1.2.4. Hệ thống giám sát tích hợp phát hiện, theo dõi, phân loại ............ 36
1.2.5. Phát hiện đối tượng ........................................................................ 38
1.2.6. Phân loại đối tượng ........................................................................ 41
1.3. Hướng tiếp cận của luận án .................................................................. 45
1.3.1. Sơ đồ khái quát hướng tiếp cận xử lý bài toán .............................. 45
1.3.2. Xác định vùng quan tâm và nhiệm vụ của luận án ........................ 47
1.4. Kết luận chương 1 ................................................................................. 49
Chương 2. PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG TỪ VIDEO DỰA
TRÊN MÔ HÌNH GAUSS HỖN HỢP THÍCH NGHI VỚI THAY ĐỔI
ÁNH SÁNG ........................................................................................................ 51
2.1. Một số thuật toán phát hiện chuyển động ............................................. 51
2.1.1. Thuật toán trừ nền cơ bản .............................................................. 51
2.1.2. Thuật toán trừ nền trung bình: ....................................................... 53
2.1.3. Thuật toán Σ-Δ: .............................................................................. 54
2.1.4. Thuật toán Σ-Δ cải tiến: ................................................................. 56
ii
2.1.5. Thuật toán thống kê khác biệt cơ bản ............................................ 58
2.1.6. Mô hình Gauss hỗn hợp ................................................................. 61
2.1.7. Đánh giá các thuật toán trừ nền thông qua một số phép đo ........... 66
2.2. Mô hình và thuật toán đề nghị .............................................................. 72
2.2.1. Mô hình GMM đề nghị .................................................................. 72
2.2.2. Thuật toán trích chọn khối chuyển động (EMB) ........................... 77
2.3. Phương pháp đếm phương tiện giao thông áp dụng mô hình GMM
thích nghi thay đổi ánh sáng kết hợp luồng quang học ............................... 78
2.3.1. Sơ đồ khối tổng quát ...................................................................... 79
2.3.2. Thuật toán phát hiện và gán nhãn cho khối (SLBBI) .................... 82
2.3.3. Thuật toán trích chọn luồng quang học (EBOF) ........................... 83
2.3.4. Kết quả thực nghiệm. ..................................................................... 86
2.4. Kết luận chương 2................................................................................. 91
Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO
DỰA TRÊN ĐẶC TRƯNG HÌNH DẠNG ........................................................ 93
3.1. Phân đoạn khối phương tiện dựa trên kích thước ................................. 93
3.1.1. Phân tích kích thước phương tiện .................................................. 93
3.1.2. Thuật toán phân loại theo kích thước ............................................ 95
3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu
hình dạng khối phương tiện ......................................................................... 98
3.2.1. Ý tưởng phương pháp .................................................................... 99
3.2.2. Giai đoạn chuẩn bị CSDL ............................................................ 100
3.2.3. Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng .... 101
3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức . 103
3.3.1. Sơ đồ khái quát............................................................................. 104
3.3.2. Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker........... 104
3.3.3. Thuật toán CCAVC...................................................................... 107
3.3.4. Kết quả thực nghiệm: ................................................................... 111
3.4. Kết luận chương 3 ............................................................................... 114
PHẦN KẾT LUẬN ........................................................................................... 116
PHỤ LỤC .............................................................................................................. 1
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ ........................................ 118
TÀI LIỆU THAM KHẢO ................................................................................. 119
iii
DANH MỤC CÁC KÝ HIỆU
Ký hiệu
Ý nghĩa
Giá trị ngưỡng cho trước trong trừ nền
B(x,y)
Giá trị nền cố định tại điểm ảnh (x,y)
It(x,y)
Giá trị điểm ảnh tại điểm ảnh (x,y)
Dt(x,y)
Mặt nạ nhị phân của đối tượng tiền cảnh
α,,,
Hằng số tỷ lệ học cho trước
t(x,y)
Giá trị tuyệt đối của hiệu giá trị điểm ảnh trừ giá trị nền của điểm ảnh
(x,y) tại thời điểm t
Vt(x,y)
Giá trị điểm ảnh (x,y) của khung hình đang xét thời gian t
xy
Giá trị trung bình của các điểm ảnh tương ứng của tập hợp điểm ảnh
(x,y) theo các khung hình đang xét
xy
Trung bình độ lệch chuẩn của điểm ảnh (x,y)
Mô hình nền thích nghi biến đổi cosin rời rạc
Khoảng cách Ơclit giữa các mô hình nền thích nghi
P(Xt)
(Xt, , )
Xác suất quan sát của điểm ảnh tại thời điểm t
Hàm mật độ xác suất tại thời điểm t
i,t
Ma trận hiệp phương sai của phân bố Gauss thứ i tại thời gian t
i,t
Giá trị trung bình của các điểm ảnh tại thời điểm t
Biến nhận giá trị 1/0 thể hiện sự phù hợp mô hình của điểm ảnh mới
k,t
Hệ số cập nhật nền K mô hình tại thời điểm t
t
Hệ số biểu thị mức độ ánh sáng thay đổi
Et
Giá trị thông tin Entropy của điểm ảnh tại thời điểm t
D(t,t-1)
i
IL(x,y)
Hàm biểu diễn cường độ sáng
Hệ số lựa chọn sự thay đổi ánh sáng
Ảnh điểm ảnh (x,y) biểu diễn mức L trong mô hình kim tự tháp
Tập biểu diễn kết quả phát hiện đối tượng tại thời điểm t
i
Tính chất thứ i của mô-men bất biến
Hằng số xấp xỉ diện tích hai hình đa giác
Lrounded
Khoảng cách giữa các điểm cơ bản trên biên
D(si,c)
Khoảng cách giữa điểm mẫu và trọng tâm đa giác
SIM(D1,D2)
Độ đo tương tự giữa 2 đa giác D1 và D2.
iv
u
Chiều dài đối tượng tính xấp xỉ
v
Chiều rộng đối tượng tính xấp xỉ
Đường viền Vector
Vector cơ sở đường viền
Tích vô hướng giữa 2 đường viền
(m)
( )
Hàm tương quan giữa 2 đường viền m đỉnh
( )
{
v
DANH MỤC CÁC CHỮ VIẾT TẮT
Chữ viết tắt
Ý nghĩa
ACF
Hàm tự tương quan (Auto Correlation Function)
BMC
Thách thức mô hình trừ nền (Background Models Challenge)
BSM
Trừ nền (Background Subtraction Method)
BGS
Thư viện trừ nền (Background Subtraction Library)
CA
Phân tích đường viền (Contour Analys)
CSDL
Cơ sở dữ liệu (Database)
EV
Vector cơ sở (Elementary Vector)
FG
Tiền cảnh (Foreground)
GMM
Mô hình hỗn hợp Gauss (Gauss Mixture Model)
ICF
Hàm tương quan (Intercorrelation Function)
NSP
Tích vô hướng chuẩn hóa (Normalized Scalar Product)
ROI
Vùng quan tâm (Region of Interest)
TVH
Tích vô hướng
VC
VVDC
đường viền vector (Vector Contour)
Phát hiện và phân loại phương tiện dựa trên video (Video-based
Vehicle Detection and Classification)
vi
DANH MỤC CÁC BẢNG
Bảng 1.1. Phân loại các phương pháp mô hình nền ...................................................... 40
Bảng 1.2. Kết quả sử dụng độ dài đường biên hình chiếu ...........................................42
Bảng 2.1. Ưu điểm và nhược điểm các thuật toán BSM đã trình bày .......................... 64
Bảng 2.2. Hệ số đánh giá toàn cục các thuật toán BS trong tập dữ liệu BMC [36]. ....69
Bảng 2.3. Dữ liệu thực nghiệm..................................................................................... 87
Bảng 2.4. Phản ứng với mật độ xe trên các cung đường ..............................................90
Bảng 2.5. So sánh thời gian xử lý của thuật toán với mỗi khung hình ......................... 90
Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL ......................................................... 98
Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS .......................................103
vii
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Cấu trúc phân đoạn của video ............................................................... 8
Hình 1.2. Các biến đổi hình dáng đối tượng trong không gian 2D. .................... 12
Hình 1.3. Biểu diễn đường viền bằng vector số phức ......................................... 14
Hình 1.4. NSP trên đường viền vector ................................................................ 18
Hình 1.5. Biểu diễn đường viền và lược đồ xám ................................................ 21
Hình 1.6. Mô tả hình dạng hình tròn ................................................................... 26
Hình 1.7. Đa giác xấp xỉ đối tượng có n cạnh..................................................... 27
Hình 1.8. Điểm mẫu căng đều trên mỗi cạnh biên .............................................. 28
Hình 1.9. Kiến trúc tổng thể hệ thống CadProTMS ........................................... 31
Hình 1.10. Trạm nghiệp vụ xử lý phạt nguội vượt đèn đỏ ngã tư ...................... 32
Hình 1.11. Cấu trúc hệ thống phát hiện và phân loại xe dựa trên video ............. 33
Hình 1.12. Sơ đồ của hệ thống giám sát giao thông tự động .............................. 35
Hình 1.13. Cấu trúc hệ thống tích hợp phát hiện, phân loại, theo dõi đối tượng 36
Hình 1.14. Cấu trúc hệ thống phát hiện đối tượng chuyển động ........................ 37
Hình 1.15. Lược đồ khái quát phân loại đối tượng dựa trên hình chiếu ............. 38
Hình 1.16. Cấu trúc khái quát hệ thống nhận dạng đối tượng chuyển động ...... 46
Hình 1.17. Sơ đồ xác định vùng nghiên cứu ....................................................... 47
Hình 1.18. Hướng tiếp cận xử lý bài toán ........................................................... 49
Hình 2.1. Lược đồ khái quát thuật toán CCA-GMMOF ..................................... 80
Hình 2.2. Minh họa thuật toán gán nhãn cho khối .............................................. 83
Hình 2.3. Dữ liệu video quay trên đường quốc lộ 5, hướng Hải phòng - Hà Nội
............................................................................................................................. 88
Hình 2.4. Một số hình ảnh từ camera đưa vào thực nghiệm ............................... 89
Hình 2.5. Giao diện kết quả thực nghiệm của hệ thống ...................................... 89
Hình 3.1. Phân tích kích thước khối xe ô tô con ................................................. 93
Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài ................................................. 95
Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng ........................................... 99
Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền .............................. 104
Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker ............ 105
Hình 3.6. Xấp xỉ hóa đường viền ...................................................................... 106
Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 111
Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 112
Hình 3.9. Ví dụ về tập mẫu để so sánh ............................................................. 113
Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy .................................... 114
1
MỞ ĐẦU
Phần này giới thiệu bài toán phát hiện và phân loại phương tiện giao thông,
những vấn đề đặt ra cho bài toán để giải quyết vấn đề tăng độ chính xác với điều
kiện giao thông đông đúc và đa dạng ở Việt Nam. Tiếp theo, trình bày mục tiêu,
phạm vi, nội dung và phạm vi nghiên cứu của luận án. Cuối cùng là giới thiệu
cấu trúc của luận án.
1. Tính cấp thiết của vấn đề nghiên cứu
Giám sát và quản lý giao thông đã và đang được các nhà khoa học thế giới
và Việt Nam quan tâm nghiên cứu phát triển. Trong điều kiện giao thông Việt
Nam, từ các tuyến đường quốc lộ, đường cao tốc, đến giao thông đô thị, giao
thông nông thôn mật độ phương tiện rất dày đặc, đa dạng về chủng loại, trong đó
hai thành phần chính đó là ô tô và xe máy. Nếu mật độ xe dày đặc, tức là số
lượng xe trên một vùng quan sát là lớn, khi đó ảnh giao thông thu được tồn tại
các phương tiện trước sau, bên cạnh liên tiếp nhau, các phương tiện tạo thành
khối phương tiện, khi đó các đường viền có thể bị che khuất thì việc phân tích
đường viền các phương tiện để phát hiện, đếm, phân loại gặp rất nhiều khó
khăn.
Nhiều nghiên cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề phát
hiện và phân loại phương tiện giao thông, tuy nhiên chưa có nghiên cứu đầy đủ
nào quan tâm đến mức độ dày đặc của phương tiện trên đường, cũng như quan
tâm đặc biệt đến phương tiện giao thông chủ yếu là xe máy và xe ô tô.
Việc lựa chọn phương pháp, thuật toán, hay phối kết hợp các thuật toán sử
dụng trong hệ thống giám sát tự động, cũng như cải tiến một số thông số kỹ
thuật trong thuật toán mang lại lợi ích cho việc phát hiện và phân loại phương
tiện giao thông trong bối cảnh Việt Nam là điều cần thiết có ý nghĩa cả về lý
thuyết và thực tiễn.
Bài toán phát hiện và phân loại phương tiện giao thông dựa trên video là
xét xem tại một thời điểm, trong vùng quan tâm, có những loại phương tiện gì,
số lượng tương ứng. Về ứng dụng, bài toán thuộc nhóm các ứng dụng liên quan
2
đến giao thông thông minh. Bài toán được ứng dụng nhiều trong lĩnh vực quản
lý giao thông, trong nhiều hoạt động an ninh, quốc phòng, kinh tế xã hội, như
cảnh báo trộm, cảnh báo cháy, giám sát bảo vệ các mục tiêu quan trọng, thu thập
các chứng cứ tại những tình huống nhạy cảm.
Yêu cầu cơ bản của bài toán phát hiện và phân loại giao thông là với dữ
liệu đầu vào là video giao thông, yêu cầu đầu ra là loại phương tiện tham gia
giao thông trong vùng quan sát (ô tô, xe máy và các phương tiện thô sơ khác).
Hướng tiếp cận giải quyết bài toán:
Thứ nhất, cần xem xét cấu trúc và phương pháp xử lý dữ liệu video. Cấu
trúc dữ liệu video được kết cấu từ tập các khung hình, tốc độ hiển thị các khung
hình trong một đơn vị thời gian (giây), mỗi khung hình là một ảnh tĩnh,...
Phương pháp xử lý dữ liệu video là việc xử lý lưu trữ, trích chọn khung hình,
phân đoạn, phân tích, trích chọn đặc trưng dựa trên cơ sở dữ liệu (CSDL) tri
thức có sẵn. Từ những tập dữ liệu video, qua quá trình xử lý, mang lại những
thông tin hữu ích theo mục đích yêu cầu của con người.
Thứ hai, cần xác định tập các đặc trưng riêng có của video giao thông. Các
đặc trưng của phương tiện chuyển động trong video được chia thành 2 mức tiếp
cận: mức cục bộ và mức toàn cục. Mức toàn cục quan tâm đến các đặc trưng
toàn cảnh như nền, đối tượng chuyển động, khối, đốm sáng. Mức cục bộ quan
tâm đến các vấn đề xử lý hình dạng, khoảng cách, đường biên,...
Đặc trưng tiếp cận ở mức toàn cục gồm:
Vùng quan tâm (ROI), hướng quan sát, khoảng cách quan sát;
Video và khung hình;
Đối tượng chuyển động và nền (Moving Object and Background);
Khối chuyển động (Block);
Đốm sáng (Blob).
Đặc trưng ở mức toàn cục ảnh hưởng nhiều đến trích chọn đối tượng
chuyển động. ROI ảnh hưởng đến việc xét điểm bắt đầu và điểm kết thúc thời
điểm quan sát, hướng quay ảnh hưởng đến hình dạng đối tượng; Video ảnh
3
hưởng đến chất lượng hình ảnh, độ phân giải, tốc độ hình; Khung hình được
trích chọn từ video thành ảnh tĩnh để phân tích,...
Đặc trưng tiếp cận ở mức cục bộ gồm:
Đối tượng chuyển động và bóng của nó (Moving Object, Shadow);
Độ dài (Visual Length);
Hình dạng đối tượng (Edge, Contour), hình dạng và đường viền;
Mức xám khu vực đèn trước/sau xe;
Mức xám và đặc điểm khu vực biển số xe, kính trước xe;
Các đường biên ngang trên xe.
Đặc trưng ở mức cục bộ, đặc biệt là độ dài, hình dạng đối tượng, các đường
biên bên ngoài và bên trong phương tiện là những đặc trưng quan trọng trong
việc phân loại phương tiện. Sử dụng một đặc trưng, hoặc kết hợp 2 hay nhiều
đặc trưng và một số kỹ thuật liên quan để phân loại phương tiện là rất hiệu quả.
Yếu tố ảnh hưởng đến phương pháp tiếp cận:
Về màu sắc phương tiện thay đổi liên tục theo thời gian, thêm vào đó có
nhiều loại phương tiện có màu sắc tương đồng nhau, do vậy việc phân loại dựa
trên màu sắc là khó khăn và không mang lại kết quả.
Về hình dạng, các phương tiện có thể đi sát nhau trong khung hình quan
sát, hợp thành các khối và dẫn đến khó xác định được chính xác đó là phương
tiện gì bằng biện pháp thông thường. Đặc biệt trong điều kiện giao thông tại Việt
Nam, mật độ phương tiện di chuyển trên đường dày đặc về mật độ, đa dạng về
chủng loại thì việc phân loại càng khó khăn. Tuy nhiên hình dạng xe ô tô, hình
dạng xe máy, phương tiện thô sơ khác là một tập có thể xác định kể cả khi chúng
hợp khối.
Ngoài việc xác định tập đặc trưng của phương tiện chuyển động trong
video, để có thể nhận dạng, xác định mật độ phương tiện, cần xác định các yếu
tố, tình huống ảnh hưởng đến phương pháp xác định các tập thuộc tính liên quan
đến phương pháp tiếp cận phát hiện và phân loại phương tiện giao thông.
Tình huống liên quan đến chuyển động gồm:
4
Đối tượng bắt đầu vào vùng quan sát;
Đối tượng ra khỏi vùng quan sát;
Đối tượng đang đi rồi dừng lại;
Đối tượng đang dừng thì chuyển động;
Nền động (dao động tự nhiên).
Tình huống liên quan đến khối chuyển động gồm:
Các đối tượng di chuyển cạnh nhau tạo thành một khối đối tượng;
Đối tượng đang di chuyển tách khối;
Đối tượng đang di chuyển thì hợp khối.
Tình huống liên quan đến chất lượng ảnh gồm nhiều yếu tố liên quan,
nhưng chủ yếu là:
Ánh sáng thay đổi;
Điều kiện thời tiết.
2. Mục tiêu nghiên cứu của luận án
- Mục tiêu chung: Từ dữ liệu video thu được từ các đường quốc lộ, tìm một
số thuật toán hợp lý để phân loại và xác định phương tiện chuyển động.
- Mục tiêu cụ thể:
+ Lựa chọn và cải tiến phương pháp phát hiện phương tiện chuyển động
phù hợp với môi trường ngoài trời, chịu tác động nhiều của sự thay đổi ánh
sáng.
+ Trích chọn các đặc trưng của phương tiện chuyển động, phân tích và biểu
diễn đặc trưng phù hợp để đề xuất và áp dụng thuật toán phân loại phương tiện
chuyển động.
+ Trên cơ sở phân tích tập thuật toán, đề xuất sự cải tiến, kết hợp các thuật
toán cho mục đích phát hiện, phân loại phương tiện giao thông trong điều kiện
giao thông đông đúc và đa dạng về chủng loại phương tiện.
3. Đối tượng và phạm vi nghiên cứu
Vấn đề "Nghiên cứu phát triển một số thuật toán phát hiện và phân loại
phương tiện từ dữ liệu video giao thông” được thực hiện chủ yếu trên môi
5
trường ngoài trời. Dữ liệu video giao thông có thể thu được từ những cung
đường khác nhau: từ các cung đường nông thôn (quận, huyện), từ các đường
quốc lộ (cao tốc), từ các đường trong đô thị (thành phố). Trong điều kiện ở Việt
Nam hiện nay, việc gắn các camera giao thông của các cơ quan quản lý và điều
khiển giao thông ở các đường quốc lộ (đường cao tốc) là phổ biến, tập dữ liệu
dùng cho việc thực nghiệm cũng thu được một cách dễ dàng hơn. Dữ liệu video
nghiên cứu trong luận án tập trung vào việc nghiên cứu dữ liệu video thu được
từ các cung đường quốc lộ. Chẳng hạn như quốc lộ 1, quốc lộ 5 và một số đường
cao tốc mới xây dựng như đại lộ Thăng long, Bắc Thăng long - Nội bài.
Luận án tập trung trình bày và giải quyết cốt lõi của hệ thống phát hiện và
phân loại phương tiện giao thông thông qua quá trình xử lý hình ảnh và đưa ra
thông tin. Bản chất của quá trình này là: phân tách video thành các khung hình;
phát hiện đối tượng chuyển động trong cảnh video; dựa vào các đặc trưng hình
học, chuyển động để phân loại và kết hợp với những đặc tính không gian, thời
gian khác để đếm các loại đối tượng chuyển động có trong video. Đối tượng
nghiên cứu của luận án gồm: Bài toán phát hiện, theo dõi và phân loại đối tượng
chuyển động; Các công trình đã và đang nghiên cứu trong và ngoài nước về vấn
đề phát hiện, theo dõi và phân loại đối tượng chuyển động; Các thuật toán,
phương pháp đã áp dụng trong vấn đề này. Các đoạn video quay cảnh giao
thông.
Tổng quát lại, đây là một phạm vi rộng, bao gồm: phát hiện, phân loại và
theo dõi đối tượng chuyển động. Luận án tập trung vào việc nghiên cứu một số
thuật toán phát hiện và phân loại đối tượng chuyển động trong vùng quan tâm;
giải quyết vấn đề ô tô, xe máy trong video giao thông mà lưu lượng giao thông
đông đúc ("dày đặc") có sự và "dính nhau" trong điều kiện Việt Nam.
4. Phương pháp nghiên cứu
Thu thập và nghiên cứu tài liệu về các nghiên cứu đã thực hiện trên thế giới
và Việt nam về vấn đề giám sát thông minh bằng hình ảnh.
6
Phân tích cấu trúc một hệ thống giám sát thông minh bằng hình ảnh; thống
kê, phân tích và đánh giá các phương pháp đã sử dụng; trên cơ sở đó thực hiện
một số công việc giải quyết bài toán:
Lựa chọn phương pháp phù hợp trong từng điều kiện hoàn cảnh khác
nhau của bài toán giám sát tự động.
Phân tích và cải tiến hệ thống về mặt cấu trúc, quy trình, khung làm
việc của hệ thống giám sát tự động.
Lựa chọn và đề xuất cải tiến một số thuật toán áp dụng.
Thử nghiệm và đánh giá kết quả một số phương pháp đề xuất:
Thu thập dữ liệu video trên một số cung đường tại đường quốc lộ.
Viết chương trình thử nghiệm bằng ngôn ngữ lập trình C++ trên môi
trường .NET.
Đánh giá và phân tích kết quả.
5. Ý nghĩa khoa học và thực tiễn của luận án
Ý nghĩa khoa học:
Làm phong phú hơn về lý luận cho phương pháp phát hiện và phân loại đối
tượng chuyển động trong video.
Tổng hợp và xây dựng một tập các phương pháp trích chọn các đặc trưng
phương tiện chuyển động, biểu diễn và xử lý các đặc trưng của phương tiện theo
từng cấp độ phù hợp cho phân loại và đếm đối tượng, bao gồm:
Đặc trưng khối chuyển động.
Đặc trưng hình dạng và kích thước đối tượng.
Đặc trưng luồng quang học.
Đặc trưng đường viền đối tượng.
Đề xuất khung làm việc chung cho bài toán xác định mật độ phương tiện
trong video giao thông.
Ý nghĩa thực tiễn:
Mở ra khả năng tính toán mới để xác định đối tượng trong ảnh nhanh hơn;
có sự phân loại tốt hơn, tránh được những thông tin dư thừa do mật độ đối tượng
7
chuyển động dày đặc, đan xen gây ra... phục vụ cho các ứng dụng thực tế như đo
lưu lượng giao thông, xác định hiện trường tai nạn giao thông, chứng thực xe đã
đi qua đoạn đường trong khoảng thời gian t,... phục vụ trong công tác an ninh.
6. Cấu trúc của luận án
Phần mở đầu. Giới thiệu tổng quát bài toán, phương pháp tiếp cận, phạm vi
nghiên cứu, những thách thức đặt ra cho bài toán, hướng nghiên cứu, ý nghĩa
khoa học, ý nghĩa thực tiễn của bài toán nghiên cứu.
Chương 1. Tổng quan về bài toán phát hiện và phân loại phương tiện trong
video giao thông. Đặt vấn đề về bài toán nghiên cứu; trình bày kết quả của một
số nghiên cứu liên quan. Đề xuất vấn đề nghiên cứu của luận án.
Chương 2. Trình bày phương pháp trích chọn đặc trưng đối tượng chuyển
động từ video. Cải tiến phương pháp GMM thích nghi với ánh sáng thay đổi. Áp
dụng kết hợp GMM thích nghi với phát hiện luồng quang học để đếm số lượng
xe trong vùng quan tâm.
Chương 3. Trình bày cách thức phân loại phương tiện giao thông thông qua
một số phương pháp: tính toán độ dài; biểu diễn hình dạng đối tượng dựa trên
vector khoảng cách từ tâm đến cạnh của đa giác xấp xỉ; kết hợp độ dài và vector
khoảng cách để nhận dạng, phân loại phương tiện trong ảnh; Áp dụng một số
tính chất của đường viền vector để phân loại phương tiện dựa trên độ dài và hình
dáng đường viền dựa trên đối sánh ảnh.
Phần kết luận. Trình bày những đóng góp và hướng nghiên cứu phát triển
tiếp theo của luận án.
8
Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG
TIỆN GIAO THÔNG TỪ VIDEO
Chương này trình bày một số phương pháp, kỹ thuật xử lý, kết quả trong
bài toán xác định mật độ phương tiện giao thông đã sử dụng. Tập trung phân
tích những kỹ thuật, phương pháp liên quan đến hướng tiếp cận của bài toán.
Bao gồm 3 nhóm phương pháp chính: phát hiện, phân loại và theo dõi. Tuy
nhiên những kỹ thuật liên quan đến máy camera, nén dữ liệu, tiền xử lý dữ liệu
không được đề cập đến trong luận án này.
1.1. Cơ sở lý thuyết và những khái niệm cơ bản
1.1.1. Dữ liệu video số
Năm 2005, Sagar Deb, University Southem Queensland, Australia, đã tổng
hợp và biên tập tài liệu Quản lý dữ liệu video và tìm kiếm thông tin [20], trong
đó đã xác định khái niệm, cấu trúc video số, cách tổ chức và xem xét cấu trúc dữ
liệu video.
Định nghĩa 1.1. Video số
Video số là một dãy các khung hình liên tiếp, mỗi khung hình tương ứng
với một hình ảnh tĩnh. Khi video được thực hiện, dãy khung hình được hiển thị
tuần tự với một tốc độ nhất định. Tốc độ hiển thị các khung hình thường là 30
hoặc 25 khung hình/giây [20].
Hình 1.1 thể hiện cấu trúc tổng quát của dữ liệu Video: khung hình, cảnh
quay, cảnh.
Hình 1.1. Cấu trúc phân đoạn của video
9
Trong kỹ thuật xử lý dữ liệu video tác động đến nhiều thành phần và các
đối tượng kéo theo của video như: cảnh, cảnh quay, khung hình, ảnh, điểm ảnh,
ngưỡng, tách ngưỡng, đường viền, nền, phép cộng ảnh, phép nhân ảnh với 1
số... Dữ liệu video và những thành phần liên quan được đặc tả hình thức bằng
ngôn ngữ đặc tả hình thức RAISE như sau:
scheme Video=
class
type
Video=Scene-list, /*Video là một danh sách các cảnh*/
Scene=Shot-list, /*Cảnh là một danh sách các cảnh quay*/
Shot=Image-list,
/*Cảnh quay là một danh sách các ảnh*/
Image=Point-set, /*Ảnh là một tập hợp các điểm ảnh*/
Point=Nat>Real
speed(v,t) is real(len(v))/t,
/* thời gian hiển thị*/
displaytime:Video>Real
displaytime(v,t) is real(Shotnumber(v))/t,
/* Số cảnh quay trong một video*/
Shotnumber:Video->Nat
Shotnumber(v) is if v= then 0
else Shotnumber(hd(v))+Shotnumber(tl(v))
end,
/* Số cảnh quay trong một cảnh */
Shotnumber:Scene->Nat
Shotnumber(s) is if s= then 0
else Shotnumber(hd(s))+Shotnumber(tl(s))
10
end,
Shotnumber:Shot->Nat
Shotnumber(sh) is if sh= then 0
else 1+Shotnumber(tl(sh))
end,
/* Định nghĩa phép tổng hai ảnh */
+: Image>Image,
tong:Shot->Image
tong(sh) is if len(sh) = 1 then hd(sh)
else hd(sh)+tong(tl(sh))
end,
/:Image>Image,
/* Định nghĩa ảnh nền */
back1:Shot->Image
back1(sh) is tong(sh)/Shotnumber(sh),
/* Định nghĩa phép nhân ảnh với một số*/
alpha: Real,
*:Real> Image,
back:Shot->Image /* anh nen*/
back(sh) is if
else
len(sh) = 1 then hd(sh)
alpha*hd(sh)+(1.0-alpha)*back( tl(sh))
end,
/* Định nghĩa ảnh biên */
constraint:Image>Bool,
anhbien:Image->Image
anhbien(I) as I1 post constraint(I,I1),
/* Tách ngưỡng */
constraint:Image>Bool,
tachnguong:Image>Image
tachnguong(I,
threshold)
constraint(I,I1,threshold)
as
I1
post
11
/* Xác định đường viền */
Check_Cycle
:Point-list-> Bool /* Kiểm tra chu trình*/
Check_Cycle(pl) is hd(pl)=ptcuoi(pl),
ptcuoi: Point-list-~->Point
ptcuoi(pl) is if len(pl)=1
then hd(pl)
else ptcuoi(tl(pl))
end
pre len(pl)>0,
end
Đặc trưng của video: Bao gồm màu, kết cấu, hình dạng và chuyển động.
- Màu (Color): Màu sắc là một đặc trưng cơ bản của ảnh. Với ảnh thì lược
đồ màu là biểu diễn sự phân bố màu trong ảnh. Biểu đồ màu không phụ thuộc
vào việc quay ảnh, dịch chuyển ảnh, hướng ảnh mà phụ thuộc vào vào hệ màu
và các phương pháp lượng tử hóa ảnh được dùng.
- Kết cấu (Texture): là một đặc trưng quan trọng của bề mặt khung hình,
nơi xảy ra việc lặp lại mẫu cơ bản. Có hai dạng biểu diễn kết cấu phổ biến: ma
trận đồng thời và Tamura. Ma trận đồng thời mô tả hướng và khoảng cách giữa
các điểm ảnh, ta có thể trích chọn được các thống kê có ý nghĩa. Biểu diễn
Tamura bao gồm các thuộc tính đo tính thô, độ tương phản, hướng, tính trơn,
tính cân đối và độ thô ráp. Các đặc tính này rất quan trọng trong việc tìm hiểu
nội dung ảnh vì nó biểu diễn rất trực quan.
- Hình dạng (Shape): đặc trưng hình dạng có thể được phân chia thành đặc
trưng toàn cục và đặc trưng cục bộ. Đặc trưng toàn cục là đặc trưng thu được từ
toàn bộ hình dáng đối tượng trong ảnh (Ví dụ: chu vi, tính tròn, hướng trục
chính...). Đặc trưng cục bộ là đặc trưng thu được từ việc thao tác với một phần
của ảnh, không phụ thuộc vào toàn bộ ảnh.
- Chuyển động (Motion): Là thuộc tính quan trọng của video. Các đặc
trưng chuyển động như mô-men của trường chuyển động, biểu đồ chuyển động,
các tham số chuyển động toàn cục có thể được trích chọn từ vectơ chuyển động.
12
1.1.2. Mô-men bất biến
Mô-men có nhiều ứng dụng trong kỹ thuật phân đoạn ảnh, đối sánh ảnh và
nhận dạng ảnh. Năm 2004, Chee-Way Chong and và cộng sự nghiên cứu về lý
thuyết môn men và ứng dụng [6]. Từ những năm 1962, tác giả Hu M. K [13] đã
đề cập đến vấn đề hệ số tương quan trong kỹ thuật phân đoạn ảnh. Dựa vào tính
chất bất biến và hệ số tương quan của mô-men để đối sánh và phân loại đối
tượng trong ảnh theo hình chiếu đối tượng trong không gian 2D.
Ứng dụng của mô-men bất biến trong nhận dạng ảnh:
Mô-men bất biến thường được dùng để trích đặc điểm trong xử lý ảnh, và
ghi nhận hình dạng đối tượng và phân lớp. Mô-men có thể cung cấp các đặc
điểm của một đối tượng duy nhất mô tả hình dạng của đối tượng.
Hình dạng đối tượng không phụ thuộc vào 3 dạng biến đổi: chuyển đổi
(thay đổi vị trí), co giãn (thay đổi kích thước) và hướng (biến đổi quay). Hình
1.2 thể hiện sự bất biến đối với phép biến đổi trong không gian 2 chiều.
Tính bất biến của chuyển đổi vị trí được xác định bởi mô-men đã được
chuẩn hóa là trọng tâm của đối tượng. Tính bất biến của biến đổi kích thước đối
tượng là sự bất biến của các giá trị đại số liên quan đã được chuẩn hóa.
Một vấn đề thiết yếu trong lĩnh vực phân tích mẫu là việc ghi nhận đối
tượng và đặc điểm ký tự cho dù đối tượng đó thay đổi vị trí, thay đổi kích thước
hay là biến đổi hướng. Mô-men bất biến được tính toán cơ bản dựa trên các
thông tin được cung cấp bởi đường biên và miền bên trong của đối tượng.
Hình 1.2. Các biến đổi hình dáng đối tượng trong không gian 2D.
13
1.1.3. Hình dạng và Khối đối tượng chuyển động
Định nghĩa 1.2. Khối đối tượng chuyển động
Khối đối tượng chuyển động là tập hợp các điểm ảnh của các đối tượng
chuyển động được trích ra từ các khung hình sau khi loại bỏ các đối tượng
không chuyển động. Khối đối tượng chuyển động có thể gồm một đối tượng độc
lập, hoặc có thể là một tập hợp các đối tượng dính nhau, che khuất nhau một
phần. Gọi I là khung hình trích ra từ video, B là các đối tượng không chuyển
động, X là khối đối tượng chuyển động, là ngưỡng sai số cho phép. Khi đó:
X=I–B+
Một số các thao tác trên X:
- Xác định X trở thành vấn đề xác định B và ngược lại.
- Loại bỏ nhiễu, tức là làm sạch X, loại bỏ những thành phần không quan
tâm ra khỏi X. Thường là xác định ngưỡng kích thước để loại bỏ những thành
phần nhỏ ra khỏi khối X quan tâm.
- Phân rã X thành các khối con: X=X1+ ... + Xn, với tiêu chuẩn phân rã là
một ngưỡng xác định để các điểm ảnh tạo thành một khối.
- Gán nhãn cho các khối con: Xác định đối tượng có trong khối.
Định nghĩa 1.3. Hình dạng khối đối tượng
Hình dạng khối đối tượng [30] là một đa giác được xấp xỉ lên đường biên
của nó. Biên đối tượng trong ảnh là một tập hợp các điểm ảnh phân biệt giữa
vùng bên trong và bên ngoài đối tượng. Gọi X là đường biên của đối tượng, DG
là đa giác xấp xỉ lên đường biên đối tượng, DT(X) là diện tích khối ảnh đối
tượng, DT(DG) là diện tích của đa giác xấp xỉ lên X. Khi đó:
DT(X) DT(DG) + , với là ngưỡng xác định cho phép sai số.
1.1.4. Đường viền đối tượng
Định nghĩa 1.4. Đường viền
Tập hợp tất cả các điểm biên của đối tượng, tạo thành một đường khép kín
bao quanh đối tượng gọi là đường viền của đối tượng, hay nói cách khác đường
viền của một đối tượng là đường biên khép kín bao quanh đối tượng [30].
14
Một số đặc tính của đường viền như độ dài, hình dáng, trọng tâm diện tích
bên trong, rất có ích để tính toán, nhận diện đối tượng là gì. Biểu diễn đường
viền trong ảnh có nhiều cách khác nhau. Trong các hệ thống thị giác máy tính,
một vài định dạng mã hóa đường viền được sử dụng như mã hóa Freeman, mã
hóa 2 chiều, mã hóa đa giác thường được sử dụng.
Phân tích đường viền (CA) [30] cho phép mô tả, lưu trữ, so sánh và tìm ra
các đối tượng biểu diễn dưới dạng đường viền. Đường viền chứa thông tin cần
thiết về hình dạng đối tượng. Không quan tâm nhiều đến các điểm bên trong của
đối tượng. Các trường hợp không quan tâm nhiều đến vùng bên trong đối tượng
nhưng quan tâm nhiều về thể hiện đường viền bên ngoài thì cho phép chuyển về
không gian 2 chiều của ảnh tức là không gian đường viền, từ đó cho phép giảm
thời gian tính toán và độ phức tạp tính toán. CA cho phép giải quyết hiệu quả
các bài toán cơ bản của nhận dạng mẫu – biến đổi, quay và tỷ lệ của ảnh đối
tượng. Phương pháp CA là bất biến đối với phép biến đổi.
Một phương pháp biểu diễn đường viền được đề nghị là biểu diễn bằng một
dãy các số phức (Xem Hình 1.3). Trên một đường viền, điểm bắt đầu cần được
xác định. Tiếp theo, đường viền sẽ được quét (xoay theo chiều kim đồng hồ), và
mỗi vector được biểu diễn bằng một số phức a+ib. Với a, b là điểm tương ứng
trên trục x, y. Các điểm được biểu diễn kế tiếp nhau.
Hình 1.3. Biểu diễn đường viền bằng vector số phức
Do tính chất vật lý của các đối tượng ba chiều, đường viền của chúng luôn
khép kín và không tự giao nhau. Nó cho phép xác định rõ ràng việc duyệt qua
15
một đường viền (xuôi/ngược chiều kim đồng hồ). Vector cuối cùng của một
đường viền luôn luôn dẫn đến điểm khởi đầu.
Định nghĩa 1.5. Đường viền vector
Đường viền được biểu diễn dưới dạng một tập các véc tơ số phức được gọi
là đường viền vector (VC) [31]. Một vector thành phần của VC được gọi là
vector cơ sở (EV).
Đường viền vector VC ký hiệu bằng chữ cái Γ và EV ký hiệu là . Khi đó,
Γ có độ dài p có thể được xác định là:
=(0, 1, ..., p-1)
Thao tác trên đường viền như là thao tác trên vector số phức có chứa nhiều
đặc tính toán học hơn là các mã biểu diễn khác. Về cơ bản, mã số phức là gần
với mã hai chiều khi mà đường viền được định nghĩa phổ biến bằng EV trong
tọa độ 2 chiều. Nhưng sự khác biệt giữa thao tác tỷ lệ của các vector đối với số
phức là khác nhau. Trường hợp này cũng ưu tiên cho các phương pháp CA.
Rohit Kolar và cộng sự, năm 2014, trong công trình [31] đã định nghĩa
nhiều khái niệm liên quan đến phương pháp CA như là: tích vô hướng của
đường viền vector, tích vô hướng chuẩn hóa, hàm tương quan, hàm tự tương
quan,...
Định nghĩa 1.6. Tích vô hướng của đường viền vector [31]
Hai số phức của 2 đường viền Γ và N, tích vô hướng (TVH) của nó là:
(
)
∑
(
)
(1.1)
với p – kích thước của VC, γn là EV của đường viền Γ, νn là EV của đường
viền N. (γn, νn) là TVH của hai số phức.
Tính chất TVH của đường viền:
TVH của các số phức được tính bằng biểu thức liên hợp [37]:
(a+ib, c+id) = (a+ib) (c-id) = ac + bd + i(bc-ad)
(1.2)
Trong CA thì VC có chiều đồng nhất, vì thế số EV là trùng nhau.
Nếu ta nhân một EV đơn giản như một vector, TVH của chúng:
((a,b),(c,d))=ac + bd
(1.3)
16
So sánh công thức này với công thức (1.2) chú ý rằng:
- Kết quả TVH của các vector là một số thực. Và kết quả tích của các số
phức là một số phức.
- Phần thực của TVH của các số phức trùng với TVH của các vector phù
hợp. Tích số phức bao gồm TVH vector.
Theo đại số tuyến tính, để xác định được chính xác chiều vật lý và các đặc
tính của TVH. TVH bằng với tích của độ dài vector của góc cosin ở giữa trong
đại số tuyến tính. Tức là 2 vector vuông góc sẽ luôn có TVH bằng 0. Ngược lại,
tích của vector thẳng hàng sẽ cho giá trị TVH tối đa.
Những đặc tính của TVH được sử dụng để đo lường độ gần của các vector.
Nếu tích càng lớn, góc giữa các vector càng nhỏ, các vector này càng gần nhau.
Với những vector vuông góc, tích này bằng 0, và hơn nữa có thể nhận giá trị âm
cho những vector có hướng khác nhau. TVH cũng có các đặc tính tương tự.
Mệnh đề 1.1. Đặc tính đường viền
1. Tổng các EV của một đường viền kín bằng 0. Nó là tầm thường đối với
các vectơ tự trỏ vào điểm khởi đầu, tổng bằng 0 tương ứng với vector 0.
2. VC thì không phụ thuộc vào phép chuyển vị song song của ảnh nguồn.
Như vậy các đường viền được mã hóa tương đối so với điểm bắt đầu, chế độ này
của mã hóa là bất biến chuyển của một đường viền ban đầu.
3. Quay ảnh theo một góc độ nào đó tương đương với quay mỗi EV của
đường viền trên cùng góc độ đó.
4. Việc thay đổi điểm khởi đầu tiến hành theo vòng tròn VC. Vì các EV
được mã hóa liên quan đến các điểm trước đó, điều này rõ ràng là thay đổi điểm
khởi đầu, trình tự của một EV sẽ là như nhau, nhưng EV đầu tiên sẽ là bắt đầu từ
điểm khởi đầu.
5. Thay đổi tỷ lệ ảnh nguồn có thể được coi là phép nhân của mỗi EV của
đường viền với một hệ số tỷ lệ.
Chứng minh:
17
Gọi tọa độ các điểm biên là z1, z2, z3, z4,…zn, z1. Khi quay zp góc ta được
điểm eizp tương tự như vậy các véc tơ hướng biên dp sẽ biến thành ei dp.
Do đó từ đầu tiên có dãy d1 d2 d3.. dn thì sau biến đổi sẽ là d’1 d’2 d’3..d’n d’1.
Trong đó d’p= e-i dp.
Như vậy [d1d2d3..dn d1][d’1d’2d’3....d’n d’1]
̅ =
=∑
Do
|∑
đó
|
∑
[d1d2..dn
̅
d1][d’1d’2..d’n
d’1]|
=
|
| |∑
̅̅̅ |
|
Vì
|∑
| là hằng số với các phép quay ,
{
Đây là điều cần chứng minh.
Định nghĩa 1.7. Tích vô hướng chuẩn hóa đường viền [31]
Tích vô hướng chuẩn hóa (NSP):
(
)
(1.4)
|Γ| và |N| - Tiêu chuẩn (chiều dài) của đường viền được tính:
(∑
)
(1.5)
Tính chất của NSP:
NSP trong không gian phức cũng là một số phức. Do vậy, tính đồng nhất là
giá trị lớn nhất có thể của chuẩn NSP (Theo bất đẳng thức Cauchy-Bunyakovsky
Schwarz): |ab| 0; cơ số logarithm là bất kỳ.
Bổ đề: h(p)=-Clog(p)
Trường hợp C = 1 và cơ số logarithm = 2 thì đơn vị tính là bit.
Khi đó: h(p)=-log(p) (đvt: bit) và Entropy của X là:
( )
(
)
∑
( )
(1.11)
Sử dụng giá trị Entropy của độ lệch (hiệu tuyệt đối) giữa khung hình hiện
thời và nền, hay nói khác đi đó chính là độ lệch về màu sắc của hai khung hình
video. Việc xác định giá trị Entropy của độ lệch này là cơ sở để xác định những
điểm ảnh của đối tượng chuyển động.
24
Sau khi xây dựng được nền tối ưu Bt(x,y) tương ứng với mỗi khung hình
hiện thời It(x,y), tính hiệu tuyệt đối Δt(x,y) giữa mô hình nền tối ưu và khung
hình hiện thời:
(
)
(
)
(
)
(1.12)
Khối ảnh, thường được sử dụng trong xử lý hình ảnh và bao đối tượng
chuyển động trong phát hiện chuyển động [22]. Giả sử ký hiệu một khối ảnh có
chiều dài và rộng bằng nhau, được ký hiệu là ww, giá trị mức xám điểm ảnh
trong khối là ww(i,j) với i,j=1..n, với n là kích thước của khối.
Giả sử, với mỗi khối ww(i,j) với hiệu tuyệt đối Δt(x,y) được tạo thành
bởi vector xám rời rạc cấp V {L0, L1, …, LV-1}. Hàm mật độ xác suất của những
( )
điểm ảnh có mức xám h của khối ww(i,j):
( )
được định nghĩa như sau:
( )
(1.13)
Trong đó: h là phần tử tùy ý của {L0, L1, …, LV-1} đại diện cho bất kỳ
vector mức xám trong mỗi khối ww(i,j);
( )
là số pixel tương ứng với mức
xám h tùy ý; Coi h0 khi h then Dt(x,y)=1
Else Dt(x,y)=0
4. Return {Dt(m,n)|t=0..NF}
Độ phức tạp thuật toán:
Gọi NF là số khung hình thu nhận từ dữ liệu video, mỗi khung hình là một
ảnh tĩnh. Gọi m, n là kích thước của mỗi khung hình. Căn cứ vào bước thứ 3
trong thuật toán, dễ dàng ước tính được số lượng các phép toán:
- Số lượng khung hình xét là NF;
- Kích thước mỗi khung hình là nm;
- Số phép toán ước tính là NFmn.
Độ phức tạp của thuật toán là O(NFmn), với NF là số khung hình; mn
là kích thước ảnh của khung hình.
53
2.1.2. Thuật toán trừ nền trung bình
BSM trung bình là một cải tiến của BSM cơ bản [17]. Thay vì giữ nguyên
giá trị khung hình nền B(x,y) trong phép trừ thì BSM trung bình cải tiến cập
nhật liên tục giá trị khung hình nền nhằm tăng tính chính xác kết quả phát hiện
đối tượng chuyển động. Gọi β là hệ số được chọn trước thuộc (0,1), ảnh nền đầu
tiên B0 gán bằng ảnh I0, ta có ảnh nền được cập nhật trung bình theo phương
trình (2.2),
Bt(x,y) = (1-)Bt-1(x,y)+It(x,y)
(2.2)
Gọi là giá trị ngưỡng sai lệch cho phép giữa các giá trị điểm ảnh của
khung hình It và ảnh nền ta có ảnh tách ngưỡng (chứa đối tượng chuyển động)
được tính theo công thức (2.3).
(
)
{
(
(
)
)
(
(
)
)
(2.3)
Trong công thức (2.3) ta có Dt(x,y) = 0, kết luận đây là điểm ảnh của nền,
ngược lại, Dt(x,y) = 1, kết luận đây là điểm ảnh của đối tượng chuyển động. Tập
hợp các điểm ảnh này ta sẽ có hình ảnh của đối tượng chuyển động.
Nội dung thuật toán:
Thuật toán trừ nền trung bình:
Đầu vào: Video
: Giá trị ngưỡng cho trước
NF: Số khung hình cần sử dụng
m,n: kích thước một khung hình (điểm ảnh)
: Tham số cập nhật nền cho trước (0,1)
Đầu ra: {Dt(m,n)| t=1..NF}
//Tập ảnh đã tách ngưỡng đối tượng chuyển động
Các bước thực hiện:
1. Thu nhận khung hình
For t=0 to NF
It = FrameCapture(video,t)
2. Khởi tạo giá trị nền ban đầu
B0 = I0
54
3. Cập nhật giá trị nền Bt(x,y) theo chỉ số khung hình và tính
mặt nạ nhị phân
For t=0 to NF
For x=0 to n
For y=1 to m
{
Bt(x,y) = (1-)Bt-1(x,y)+It(x,y)
If |It(x,y)-Bt(x,y)|> then Dt(x,y)=1
Else Dt(x,y)=0
}
4. Return {Dt(m,n)|t=0..NF}
Độ phức tạp thuật toán:
Tương tự như trình bày trong thuật toán trừ nền trung hình, số phép toán
ước tính tổng quan chung của thuật toán tập trung ở bước 3.
Độ phức tạp của thuật toán là O(NFmn), với NF là số khung hình; mn
là kích thước ảnh của khung hình.
2.1.3. Thuật toán Σ-Δ
Thuật toán Σ-Δ dựa trên phương pháp đệ quy phi tuyến đơn giản (còn được
gọi là bộ lọc Σ-Δ). Thuật toán Σ-Δ sử dụng hàm sgn(a) để ước lượng giá trị của
nền, công thức (2.4). Hàm sgn() được xây dựng như sau:
( )
{
(2.4)
Theo công thức (2.5), giá trị nền đối với mỗi khung hình tại thời điểm t là
Bt(x,y), tăng hoặc giảm hoặc giữ nguyên tùy thuộc vào giá trị của hàm sgn(a).
t(x,y) là giá trị tuyệt đối hiệu giữa Bt(x,y) và It(x,y) theo công thức (2.6).
Gọi Vt(x,y) là biến ngưỡng xác định cho sự chuyển động theo thời gian t,
nhằm xác định xem mỗi điểm ảnh của một khung hình đang xét sẽ là điểm ảnh
“nền” hay điểm ảnh của “đối tượng chuyển động”, được tính theo công thức
(2.7), với N là tham số cho trước trong khoảng từ 14;
55
Giá trị Dt(x,y) là giá trị lưu trữ nền hoặc đối tượng chuyển động. Nếu
Dt(x,y)=0 thì điểm (x,y) là của nền, ngược lại điểm ảnh của đối tượng chuyển
động, công thức (2.8).
= It(x,y) – Bt-1(x,y)
Bt(x,y) = Bt-1(
(
(
)
)
(
(
(
)
)
)
)
(
(
(
(
(
{
( )
)
)
(2.5)
)
(2.6)
)
(
(
(
))
)
)
(2.7)
(2.8)
Nội dung thuật toán:
Thuật toán Σ-Δ
Đầu vào: Video
: Giá trị ngưỡng cho trước
NF: Số khung hình cần sử dụng
m,n: kích thước một khung hình (điểm ảnh)
α: Tham số cập nhật nền cho trước [0,1]
Đầu ra: {Dt(m,n)| t=1..NF}
//Ảnh đã tách ngưỡng đối tượng chuyển động
Các bước thực hiện:
1. Thu nhận khung hình
For t=0 to NF
It = FrameCapture(video,t)
2. Khởi tạo giá trị nền ban đầu
B0=I0 //Giá trị khởi tạo mô hình nền và khung hình video đến.
0 = 0
V0 = 0
3. Cập nhật giá trị nền Bt theo chỉ số khung hình và tính mặt
nạ nhị phân
For each Image It
For each x,y [n,m]
{
= It(x,y) – Bt-1(x,y)
Bt(x,y) = Bt-1(
)
( )
56
(
)
(
)
(
)
(
(
)
)
(
(
)
(
))
If |t(x,y)-Vt(x,y)|> then Dt(x,y)=1
Else Dt(x,y)=0
4. Return {Dt(m,n)| t=1..NF}
Độ phức tạp thuật toán:
Gọi NF là số khung hình thu nhận từ dữ liệu video, mỗi khung hình là một
ảnh tĩnh. Gọi m, n là kích thước của mỗi khung hình. Căn cứ vào bước thứ 3
trong thuật toán, dễ dàng ước tính được số lượng các phép toán tương đương với
O(NFnm), với NF là số khung hình; n, m là kích thước khung hình.
2.1.4. Thuật toán Σ-Δ cải tiến
Thuật toán Σ-Δ cập nhật mô hình nền theo hằng số thời gian sgn(a). Điều
này tạo ra hạn chế đối với những ảnh chứa nhiều đối tượng chuyển động hoặc
đối tượng có nhiều chuyển động. Thuật toán Σ-Δ cải tiến được đề xuất để giải
quyết bài toán nhiều đối tượng và nhiều chuyển động. Phương pháp này sử dụng
mô hình nền thích nghi để tăng khả năng phát hiện các chuyển động trong một
ảnh phức tạp.
Việc xử lý theo thời gian có thể cho ra kết quả phát hiện chuyển động rất
hiệu quả trong trường hợp đối tượng chuyển động chậm dần, dừng lại hoặc quay
vòng. Tuy nhiên, do thuật toán Σ-Δ đặc trưng bởi khoảng thời gian cố định: cập
nhật theo giai đoạn và độ lớn số lượng mức xám trên một giây. Đây là lý do gây
ra hạn chế của thuật toán Σ-Δ trong việc thích nghi với khung hình phức tạp nhất
định.
Thuật toán Σ-Δ cải tiến thay vì tính một nền riêng lẻ, chúng ta sẽ tính một
tập các nền: {
}. Công thức tính như sau:
(
Trong đó,
)
(
(
)
(
(
)
(
))
(2.9)
) là giá trị nền tham chiếu thứ i tại thời điểm t,
là giá trị nền tham chiếu thứ i tại thời điểm (t-1),
chiếu thứ (i-1) tại thời điểm t, giá trị khởi tạo với i=0:
(
(
(
)
) là giá trị nền tham
)
(
).
57
Mỗi nền
được đặc trưng bởi thời gian cập nhật
(
Với mỗi khung hình, tính giá trị hiệu tuyệt đối
(
biến theo thời gian
) it ( x, y) và giá trị
) như sau:
(
(
.
)
)
(
| (
)
)
(
(
)|
(
(
(2.10)
(
))
(2.11)
Giá trị mô hình nền thích nghi tổng hợp Bt ( x, y ) được tính như sau:
(
)
∑
(
∑
)
(
(
)
(2.12)
)
Với i là giá trị được định nghĩa trước, i là chỉ số tham chiếu, R là tổng số
chỉ số i. Giá trị thực nghiệm đặt K=3, α1, α2, α3 được đặt 1, 8, 16.
Trên mô hình nền thích nghi Bt(x,y) đã được tạo ra, áp dụng thuật toán Σ-Δ
với mô hình nền Bt(x,y) này để xử lý xác định đối tượng chuyển động.
Nội dung thuật toán:
Thuật toán Σ-Δ cải tiến
Đầu vào: Video
: Giá trị ngưỡng cho trước
NF: Số khung hình cần sử dụng
m,n: kích thước một khung hình (số điểm ảnh theo chiều
ngang, dọc)
K: số lượng tập nền theo dõi cho trước
αi(i=1..K): Tham số cập nhật nền cho trước [0,1]
Đầu ra: {Dt(m,n)| t=1..NF} //Tập ảnh đã tách ngưỡng đối tượng
1. Thu nhận khung hình
For t=0 to NF
It= FrameCapture(video,t)
2. Khởi tạo giá trị nền và các tham số ban đầu
For i=1 to K
{
0 = 0
}
58
V0 = 0
For i=1 to K
{αi=const}
3. Cập nhật giá trị nền Bt theo chỉ số khung hình và tính mặt
nạ nhị phân
For t=0 to NF
For x=0 to n
For y=1 to m
{
For i=1 to K {
(
)
(
)
(
)
(
| (
)
)
(
(
(
(
)
(
))
)|
)
(
(
)
(
))
} //End of for i
For i=1 to K {
TS=TS +
( (
MS=MS +
))
(
(
)
)
Bt(x,y) = TS/MS
}
t(x,y) = |It(x,y)-Bt(x,y)|
Vt(x,y) = Vt-1(x,y) + sgn(N×t(x,y)-Vt-1(x,y))
If t(x,y)>Vt(x,y) then Dt(x,y)=1
Else Dt(x,y)=0
} //End of for t
4. Return {Dt(m,n)| t=1..NF}
Độ phức tạp thuật toán:
Gọi NF là số khung hình thu nhận từ dữ liệu video, mỗi khung hình là một
ảnh tĩnh. Gọi m, n là kích thước của mỗi khung hình. Gọi k là số tập nền cần
theo dõi. Căn cứ vào bước thứ 3 trong thuật toán, dễ dàng ước tính được số
lượng các phép toán tương đương với O(NFkmn).
2.1.5. Thuật toán thống kê khác biệt cơ bản
Thuật toán thống kê khác biệt cơ bản tính giá trị trung bình cho từng điểm
ảnh riêng lẻ của khung video trước đó dựa trên việc sử dụng giá trị trung bình,
59
độ lệch tiêu chuẩn cũng như sắp xếp mô hình nền. Mô hình nền thích nghi được
tạo ra thông qua việc xác định giá trị từng điểm ảnh xy của mô hình nền. Giá trị
xy được tính là giá trị trung bình của các điểm ảnh tương ứng từ một tập K
khung hình trước đó trong một khoảng thời gian nhất định từ thời điểm khung
video đầu tiên đến thời điểm khung video thứ K-1 (có thể coi khoảng thời điểm
từ t0 – tK-1).
∑
(
)
(2.13)
K: là số lượng khung video đang xét; t: là chỉ số của khung video, t = 1..K;
It(x,y): là giá trị khung video đến hiện thời thứ t.
Với mỗi điểm ảnh, một giá trị ngưỡng biểu diễn bằng độ lệch chuẩn xy
trong cùng một khoảng thời gian (t0 – tK-1), được tính bằng trung bình độ lệch
giữa giá trị của điểm ảnh tương ứng trong các khung video trước và xy, công
thức tính như sau:
( ∑
( (
)
) )
(2.14)
Để phát hiện được chuyển động, giá trị tuyệt đối của hiệu giữa khung video
đến và mô hình nền được tính toán. Từ đó ta sẽ xác định mặt nạ nhị phân phát
hiện chuyển động Dt(x,y) được tính bởi công thức sau:
(
)
{
| (
)
|
| (
)
|
(2.15)
Ta chọn là tham số thực nghiệm. Phương pháp chọn được giải thích
như sau: Theo [23], có nhiều cách để thể hiện các đặc tính của một phân phối
xác suất. Cách dễ thấy nhất là thông qua hàm mật độ xác suất, nó cho biết khả
năng xảy ra của mỗi giá trị của biến ngẫu nhiên. Hàm phân phối tích lũy cũng
cho cùng thông tin, nhưng hình ảnh của nó thì thông tin chứa đựng không được
dễ nhận thấy cho lắm. Các cách tương đương khi chỉ định một phân phối chuẩn
là thông qua: mômen, ước lượng, hàm đặc trưng, hàm khởi tạo mômen, và hàm
khởi tạo ước lượng và định lí Maxwell. Một số rất hữu ích về mặt lí thuyết,
60
nhưng không trực quan. Hàm mật độ xác suất của phân phối chuẩn với trung
bình và phương sai 2 (hay, độ lệch chuẩn ). Hàm mật độ là đối xứng qua giá
trị trung bình (giá trị kì vọng). Giá trị trung bình cũng là mode và trung vị của
nó. Ta có 68.26894921371% của diện tích dưới đường cong là nằm trong
khoảng 1 lần độ lệch chuẩn tính từ trị trung bình (tức là khoảng (-, +));
95.44997361036% của diện tích dưới đường cong là nằm trong khoảng 2 lần độ
lệch chuẩn (-2,+2); 99.73002039367% của diện tích dưới đường cong là
nằm trong khoảng 3 lần độ lệch chuẩn (-3,++). Do đó việc chọn 1) then α=1
7. Tính toán các tham số của gauss
for i = 1 to k
{
8.
Tính độ lệch chuẩn σ2 cho mỗi kênh màu
i+1(u,v)2 = (1-α) i-1(u,v)2 + αi(u,v)2
9.
Cập nhật hệ số lặp mô hình
i,t+1 = (1-α)i,t + αMt – αCT
}
10.
Sắp xếp mức độ ưu tiên
min (/) min_var()
11. Cập nhật giá trị nền
{∑
∑
}
Bước 2. Tách nền và tiền cảnh
12. For each pixel (u,v) in ROI template
if | I(u,v) – B| > TROI
else
FGt(u,v) = 1 (Tiền cảnh)
FGt(u,v) = 0 //Nền
13. Return FGt(u,v)
Độ phức tạp thuật toán:
Giả sử tại thời điểm t xem xét chuỗi gồm số lượng NF khung hình được
trích chọn từ thời điểm trước tới thời điểm t. Số bước thực hiện duyệt qua toàn
bộ các khung hình là NF (For i=1 to NF).
Giả sử mỗi bức ảnh của khung hình phân tích có kích thước là (n m), số
điểm ảnh cần duyệt qua mỗi khung hình là n m ( For j=1 to nm).
Số phép toán ước tính là: NF n m.
Độ phức tạp ước tính của thuật toán EMB là O(NF n m), với NF là số
khung hình, n và m là kích thước ảnh của mỗi khung hình.
2.3. Phương pháp đếm phương tiện giao thông áp dụng mô hình GMM
thích nghi thay đổi ánh sáng kết hợp luồng quang học
79
Trong tài liệu [3], nhóm Trần Thanh Việt dựa trên luồng quang học để bám
đối tượng chuyển động. Tuy nhiên, đối với vấn đề đếm xe trên đường cao tốc,
để đối phó với sự thay đổi ánh sáng môi trường ngoài trời có thể vận dụng kết
hợp mô hình GMM thích nghi với ánh sáng và luồng quang học để thiết kế hệ
thống. Một số kết quả thực nghiệm cho thấy phương pháp này cho kết quả khá
tốt trong môi trường thực và mức độ dính nhau trong khung hình của các
phương tiện là ít (thưa), mức độ chính xác giảm dần khi mức độ dính nhau tăng.
2.3.1. Sơ đồ khối tổng quát
Mục đích đếm số lượng đối tượng chuyển động, sử dụng phương pháp phát
hiện đối tượng chuyển động dựa trên mô hình GMM thích nghi sự thay đổi ánh
sáng và kết hợp luồng quang học.
Sơ đồ hệ thống của phương pháp chúng tôi đề nghị bao gồm 6 bước cơ bản.
Bắt đầu từ xác định vùng quan tâm trên đường, thu nhận video từ camera,... kết
quả cho ra số lượng đối tượng đang chuyển động trong vùng quan tâm. Sơ đồ
khối của phương pháp xử lý được thể hiện trong Hình 2.1.
(1) Xác định ROI: vùng quan tâm chịu ảnh hưởng của phương pháp đặt
camera để thu nhận dữ liệu video. Có nhiều cách để đặt camera, như đặt bên
hông đường, đặt trực diện ở trên tầm cao, đặt trực diện ở tầm thấp,... Ở đây xác
định đặt camera trên độ cao phù hợp, ngang tầm với các cầu vượt đường cao tốc
(tương tụ như các camera giao thông đang sử dụng hiện nay) để theo dõi trực
diện phương tiện chuyển động. Vùng quan tâm được xác định là cặp vạch ảo
thiết lập trên làn đường theo chiều ngang. Khung hình được thu nhận liên tiếp từ
vạch thứ nhất (ở xa) và được theo dõi, phân tích cho đến khi ra khỏi vạch thứ hai
(ở gần).
(2) Căn cứ vào cấu trúc và cấu hình của camera mà xác định số lượng
khung hình trích chọn cho phù hợp. Theo cấu trúc dữ liệu Video hiện sử dụng
thường có tốc độ 25frames/giây. Dùng thuật toán nắm bắt khung hình kết hợp
với bộ đồng hồ trong ngôn ngữ lập trình có thể thu nhận dữ liệu các khung hình
thành file ảnh màu tương ứng.
80
Bắt đầu
1. Xác định ROI
2. Trích chọn khung hình trong ROI
3. Trích chọn đối tượng chuyển động (mặt nạ) và tiền xử lý
4. Xác định khối và gán nhãn cho khối đối tượng
5. Xác định và trích chọn luồng quang học trên từng khối
6. Thực hiện đếm số lượng xe
Kết thúc
Hình 2.1. Lược đồ khái quát thuật toán CCA-GMMOF
(CCA-GMMOF - Car Counting Alogorithm using GMM and Optical Flow)
(3) Trích chọn đối tượng chuyển động và tiền xử lý. Căn cứ vào dãy các
khung hình thu được, sử dụng BSM, áp dụng mô hình GMM thích nghi ánh
sáng để phát hiện mặt nạ đối tượng chuyển động. Ảnh nhị phân được làm sạch
bằng phương pháp loại bỏ nhiễu. Nhiễu được xác định là các khối có kích thước
nhỏ theo quy ước của một ngưỡng đối tượng tương ứng xác định trước. Áp dụng
phương pháp loại bỏ nhiễu, những đối tượng không phải là phương tiện chuyển
động, kích thước bé,... ra khỏi mặt nạ phương tiện chuyển động, tiếp tục nhị
phân hóa ảnh mặt nạ phương tiện. Nội dung chi tiết được trình bày trong thuật
toán EMB (Extract Moving Block).
(4) Mặt nạ đối tượng chuyển động chứa các khối chuyển động riêng biệt
trong ảnh nhị phân. Cần phải gán nhãn cho các khối này, hoặc chỉ mục hóa các
khối này để chuyển sang giai đoạn sau là phân tích hình dạng và đường viền.
Thuật toán phân đoạn khối và gán nhãn cho khối được trình bày trong thuật toán
SLBBI (Segmentation and Labling to Block for Binary Image).
81
(5) Xác định và trích chọn luồng quang học trên từng khối: Luồng quang
học là đường đi của một điểm ảnh giữa các khung hình được trích ra từ một
video. Gọi p(x0,y0,t0) là điểm ảnh thuộc khung hình I(t0) tại thời điểm t0, điểm
p(xn,yn,tn) là điểm ảnh đó tại khung hình I(tn), với n>=1. Luồng quang học được
xác định khi: p(xn,yn,tn) = p(x0,y0,t0) +d; với d là khoảng cách điểm ảnh giữa thời
điểm t0 và tn; vấn đề đặt ra với luồng quang học là xác định được độ dài d. Nếu
độ dài d=0 thì coi như không có luồng quang học, và đối tượng không chuyển
động. Thuật toán trích chọn luồng quang học được trình bày trong thuật toán
EBOF(Extract Blob from Optical Flow).
(6) Thực hiện đếm xe: Thực hiện chọn 1 điểm trên mỗi block khi xuất hiện
ở vạch xuất phát ở xa hướng quan sát, nếu điểm này sau một khoảng các khung
hình chạm tới vạch đích (gần hướng quan sát) thì xác định đây là một khối đối
tượng chuyển động.
Thuật toán đếm xe CCA-GMMOF:
Đầu vào: Video
Đầu ra: Số lượng xe ô tô
Các bước thực hiện:
1. Xác định ROI và khởi tạo
ROI (x1,y1,x1,y2;x2,y1,x2,y2)
Khởi tạo count = 0;
2. Trích chọn khung hình trong ROI
frames read_frame(videoSource);
grayFrame convert_to_gray(frame);
roiFrame region_interest(grayFrame) ;
3. Trích chọn mặt nạ đối tượng chuyển động và tiền xử lý
binaryImage EMB(roiFrame);
filterBinaryImage morphology(binaryImage);
4. Phát hiện khối và gán nhãn cho khối
Block[i] SLBBI(filterBinaryImage)
5. Phát hiện và theo dõi luồng quang
for each(c in blocks)
If (c satisfy as vehicle) Generate tracking point Pi in object c
82
Pi +1 = optical_follow(Pi)
6. Thực hiện đếm xe
For each(tracking point Pi)
If (Pi + n) reach counting line Count++;
else delete Pi;
7. Return Count;
2.3.2. Thuật toán phát hiện và gán nhãn cho khối (SLBBI)
Mô tả thuật toán:
Giả sử có ảnh nhị phân như hình dưới (màu đen là nền, màu trắng là đối
tượng). Duyệt qua lần lượt các điểm ảnh theo từng hàng. Từ trái qua phải, từ
trên xuống dưới. Có các trường hợp xảy ra như là: điểm ảnh là nền, điểm ảnh là
đối tượng. Khi điểm ảnh là đối tượng, xét các điểm ảnh lân cận. Căn cứ vào các
điểm ảnh lân cận mà quyết định gán nhãn cho điểm ảnh là nhãn đã gán hoặc mở
nhãn mới. Sơ đồ khối tổng quát của phương pháp thể hiện trong Hình 2.2.
Ý tưởng của phương pháp:
(a)
(b)
(c)
(d)
(e)
(f)
83
(g)
(h)
(i)
(k)
Hình 2.2. Minh họa thuật toán gán nhãn cho khối
Trong đó:
(a) Bắt đầu duyệt ảnh từ trái qua phải, từ trên xuống dưới
(b) Xác nhận một vùng mới có các lân cận chưa gán nhãn
(c) Thiết lập điểm ảnh hiện tại và tăng nhãn lên 1
(d) Kiểm tra các lân cận tiếp theo
(e) Gán nhãn cho lân cận bên cạnh
(f) Dịch chuyển đến vùng mới bên phải
(k) Kết quả gán nhãn
Thuật toán SLBBI tương tự như thuật toán gán nhãn vùng trong ảnh, đã có
nghiều công trình nghiên cứu cài đặt thử nghiệm. Trong nghiên cứu của luận án
không trình bày lại thuật toán này mà chỉ sử dụng kết quả của các nghiên cứu có
trước.
2.3.3. Thuật toán trích chọn luồng quang học (EBOF)
Mô tả thuật toán:
Xây dựng hàm biểu diễn ảnh theo hình kim tự tháp, trong công trình [14],
[18] đã xây dựng cách biểu diễn ảnh ở các mức khác nhau, theo hình kim tự
tháp. Áp dụng cách biểu diễn này để xây dựng thuật toán Lucas-Kanade, xác
định mối liên quan giữa 2 điểm ảnh trên 2 khung hình khác nhau.
Cho ảnh I(nx,ny);
Đặt I0=I là ảnh mức 0, với
;
Biểu diễn truy hồi ảnh mức 1 qua ảnh mức 0, mức 2 qua mức 1,...
84
(
)
(
(
(
(
[
)
(
)
)
(
))
(
(
)
)
(
(2.45)
(
)
)
(
))
Để đơn giản trong các ký hiệu, chúng ta có thể viết như sau:
(
(
(
)
)
)
(
(
[
(
(
(
(
)
)
)
)
)
(
(
)
(2.46)
)
)
(
)
trong đó:
,
(2.47)
,
(2.48)
Phương pháp luồng quang học, Trần Thanh Việt và cộng sự, năm 2011 [3]
thực hiện bằng cách sử dụng các vector có hướng của các đối tượng chuyển
động theo thời gian để phát hiện các vùng chuyển động trong một ảnh.
Trong [3], đã trình bày nghiên cứu kỹ thuật luồng quang học để ứng dụng
thử nghiệm theo vết đối tượng trong camera và dựa trên các hành vi của đối
tượng để điều khiển thiết bị máy tính như chuột, lướt web, ra các sự kiện bấm
chuột, bấm đúp chuột, phóng to, thu nhỏ.
Ý tưởng quan trọng của phương pháp tính luồng quang học dựa trên giả
định:
Bề ngoài của đối tượng không có nhiều thay đổi (về cường độ sáng) khi xét
từ khung hình thứ n sang khung hình n+1. Nghĩa là:
(̅ )
(̅
̅
)
(2.49)
85
Trong đó là hàm trả về cường độ sáng của điểm ảnh tại thời điểm t (khung
hình thứ t) là tọa độ của điểm ảnh trên bề mặt (2D), là vector vận tốc, thể hiện sự
thay đổi vị trí của điểm ảnh từ khung hình thứ t sang khung hình t+1).
Gọi xt = {xm,t; m =1,…,M} là tập các đối tượng tại thời điểm t. Trong đó, M
là số đối tượng có trong hệ thống, M có thể thay đổi theo thời gian.
Gọi
là tập biểu diễn kết quả phát hiện đối tượng của hệ tại thời điểm t
tương ứng. Ta có:
{
}
(2.50)
D là số đối tượng phát hiện được.
Gọi
{
||
||
} với ngưỡng cho
trước là tập các kết quả phát hiện “cũ”, được hiểu theo nghĩa, nếu một phát hiện
trong thời điểm t quá gần với một trạng thái đã có tại thời điểm t-1 thì nó sẽ
được xem là trùng với đối tượng đó. Một cách gần đúng, giả định những phát
hiện này xuất phát từ đối tượng đã có từ thời điểm t-1 trước đó.
Tương tự, ta định nghĩa
là tập những phát hiện “mới”,
được hiểu là giữa tập các điểm mới và tập các điểm cũ cách nhau một khoảng d.
Trích chọn luồng quang học tức là theo dõi cùng một điểm ảnh giữa các
khung hình, xem nó có chuyển động hay không. Luồng quang học rất cần thiết
cho việc xác định đối tượng chuyển động trong vùng quan sát. Giả sử điểm ảnh
tại thời điểm bắt đầu vùng quan sát, sau 1 thời gian t, tiếp cận đến điểm kết thúc
của vùng quan sát, điều này có thể kết luận có 1 đối tượng chuyển động.
Nội dung thuật toán:
Thuật toán theo dõi xe thông qua luồng quang học EBOF
Đầu vào: Video (online or offline)
Đầu ra: Đặc trưng của véc tơ luồng quang học v
Các bước thực hiện:
1) For each foreground frame at time t
2) If mod(t,Tof)=0 then
2.1. f1 BF
86
2.2. Top(BF) f2
2.3. Lucas-Kanade(f1,f2)
2.4. Feature V
Function Lucas-Kanade(I,J)
{
1) Image Description
ImageLevelFunction(I)
ImageLevelFunction(J)
[
Init
[
]
]
2) for L=Lm downto 0 with step=-1
[
2.1.
]
2.2.
(
)
(
)
(
)
2.3.
(
)
(
)
(
)
2.4.
∑
2.5.
∑
[
[
(
( )
) (
(
)
) (
( )
)
]
]
2.6. for k=1 to K with step=1 {
3)
4) v = u + d
5) Return v }
Độ phức tạp tính toán trích chọn luồng quang học: O(n2).
2.3.4. Kết quả thực nghiệm.
Theo kết quả trong nghiên cứu công bố trong công trình công bố số 3, mức
độ hợp khối (dính nhau) của các phương tiện giao thông là số phương tiện trong
vùng quan tâm hoàn toàn độc lập, có dính nhau đôi một, có dính nhau nhiều.
Khi không có sự dính khối, luồng quang học được xác định rõ ràng hơn, nên kết
quả nhận dạng và đếm dễ dàng. Mật độ được gọi là thưa nếu số lượng tại thời
87
điểm xét trong vùng quan tâm chỉ có duy nhất một phương tiện; mật độ được gọi
là tương đối thưa, tại thời điểm xét, số phương tiện nhiều hơn 1, nhưng không có
sự chồng lấp, che khuất nhau; và mật độ được gọi là dày đặc, nếu số lượng
phương tiện lớn hơn 1, nhưng có sự chồng lấp lên nhau và che khuất nhau.
Hệ thống thực nghiệm áp dụng GMM thích nghi sự biến đổi ánh sáng kết
hợp luồng quang học đếm số lượng xe trong vùng quang tâm. Hệ thống được cài
đặt trên môi trường Microsoft Vision Studio 12 và thư viện mã nguồn mở
EMGU.
Dữ liệu đầu vào được thu thập thực tế tại 5 cung đường: Cao tốc Bắc
Thăng Long - Nội bài; Đại lộ Thăng Long; Quốc lộ 1 khu vực cầu Bồ Sơn - Bắc
Ninh; Quốc lộ 5 đoạn đi qua cầu vượt Như Quỳnh. Mỗi cung đường bao gồm 7
đoạn video thu thập dưới các điều kiện thời tiết khác nhau. Các ảnh liên tiếp sử
dụng trong thực nghiệm được ghi lại bởi một camera màu đặt ở chính giữa làn
đường phía trên một cầu vượt. Hướng của camera song song với hướng chuyển
động của đối tượng.
Bảng 2.3. Dữ liệu thực nghiệm
Cung
đường
Bắc
Thăng
Long
Đại lộ
Thăng
Long
Quốc lộ 1
Quốc lộ 5
Nắng
Mây
Số lượng video/khung hình thu thập
Ngày
Buổi
Lúc mặt
Sương
mưa
trưa
trời lặn
mù
Mưa ban
đêm
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1500frame 1500frame 1500frame 1500frame 1500frame 1500frame 1500frame
1.5 phút/
1.5 phút/
1.5
1.5 phút/
1.5 phút/
1.5 phút/
1.5 phút/
2250frame 2250frame 2250frame 2250frame 2250frame 2250frame 2250frame
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1 phút/
1500frame 1500frame 1500frame 1500frame 1500frame 1500frame 1500frame
1.1 phút/
1.1 phút/
1.1 phút/
1.1 phút/
1.1 phút/
1.1 phút/
1.1 phút/
1650frame 1650frame 1650frame 1650frame 1650frame 1650frame 1650frame
Thực nghiệm so sánh trên 112 đoạn video tại 4 cung đường khác nhau. Thử
nghiệm trên máy tính tốc độ xử lý 2.5GHz. Trước hết so sánh mục tiêu ảnh
hưởng của mức độ dày đặc của luồng phương tiện (số lượng xe di chuyển trong
1 phút), chất lượng video ảnh hưởng đến mức độ chính xác, tiếp theo sau đó
thực hiện thử nghiệm thời gian xử lý của thuật toán.
88
Hình 2.3. Dữ liệu video quay trên đường quốc lộ 5, hướng Hải phòng - Hà Nội
a) Đối tượng chuyển động trên quốc lộ 5, hướng từ Hải phòng về Hà Nội.
- Ký hiệu: V1[i,j,k]
- Buổi sáng, trưa, chiều, tối ứng với i=0,1,2,3
- Trời nắng, trời mưa, ứng với j=0,1
- Số thứ tự video ứng với k=0,1,...,9
b) Đối tượng chuyển động trên đường liên tỉnh, hướng Lương Tài về Quốc lộ 5
- Ký hiệu: V2[i,j,k]
- Buổi sáng, trưa, chiều, tối ứng với i=0,1,2,3
- Trời nắng, trời mưa, ứng với j=0,1
- Số thứ tự video ứng với k=0,1,...,9
c) Đối tượng di chuyển chiều Hà Nội đi Lạng Sơn
- Ký hiệu: V3[i,j,k]
- Buổi sáng, trưa, chiều, tối ứng với i=0,1,2,3
- Trời nắng, trời mưa, ứng với j=0,1
89
- Số thứ tự video ứng với k=0,1,...,9
Hình 2.4 minh họa dữ liệu video đầu vào ở các mức độ mật độ giao thông
khác nhau tại một số cung đường cao tốc ở phụ cận Hà Nội.
a) Xe trên đường đại lộ Thăng
Long. Time: 1m14s;
Size: 640x480;
Frame rate: 15 frame/s;
Mức độ khối: đơn xe
b) Xe trên sân bay nội bài
Time: 1m06s;
Size: 704x480;
Frame rate: 7frame/s.
Mức độ khối: có dính đôi
c) Xe trên cầu Thanh Trì
Time: 1m14s;
Size: 640x480;
Frame rate: 15 frame/s;
Mức độ khối: dính nhiều
Hình 2.4. Một số hình ảnh từ camera đưa vào thực nghiệm
Hình 2.5, minh họa một số giao diện của hệ thống thực nghiệm. Hình bên
trái thể hiện vùng quan sát. Hình bên phải trên thể hiện các đốm sáng phát hiện
đối tượng chuyển động và đánh dấu luồng quang học. Hình bên phải dưới là mặt
nạ nhị phân sau khi thực hiện hiện phép trừ nền.
Hình 2.5. Giao diện kết quả thực nghiệm của hệ thống
Sau khi tiến hành thử nghiệm và so sánh với các kỹ thuật trừ ảnh và trừ nền
về mức độ lỗi trung bình, độ nhiễu và tỷ lệ chính xác khi gặp phải nguồn ảnh
hoặc nguồn video chất lượng thấp, hoặc mức độ dày đặc của dòng phương tiện
thì phương pháp lồng quang học kết hợp tái chọn mẫu đạt được độ ổn định qua
bảng đánh giá sau:
90
Bảng 2.4. Phản ứng với mật độ xe trên các cung đường
Số khung
hình theo
dõi
Mức độ dính
khối
Số
lượng
thực
Số lượng
đếm bằng
phần mềm
Độ
chính
xác
Cầu Như Quỳnh
1450
Tách rời nhau
35
35
100%
Đại lộ Thăng Long
1110
Dính nhau từng
đôi
115
120
95.83%
Sân bay nội bài
462
Dính nhau ba
70
80
87.50%
Cầu Thanh Trì
1450
Dính nhau
nhiều
170
185
87.17%
Cung đường
Tại Bảng 2.4, thấy rằng hệ thống phản ứng với mật độ rất rõ nét; khi các
xe không chồng lấp lên nhau độ chính xác lên tới 100%; ở mật độ dày tăng lên,
các xe có sự chồng lấp hoặc bóng hình làm chồng chấp, thuật toán tách khối
chưa được áp dụng, dẫn đến sai số. Số lượng xe đếm được của hệ thống có xu
hướng cao hơn số lượng thực, lý do có thể do ngưỡng đặt phân khối ô tô còn bé,
hệ thống có thể đếm nhầm sang xe máy. Các vấn đề này có thể khắc phục khi hệ
thống được phát triển kết hợp bài toán phân loại và theo dõi các loại đối tượng
độc lập (đếm cả đếm xe máy và các phương tiện khác).
Bảng 2.5. So sánh thời gian xử lý của thuật toán với mỗi khung hình
Phương pháp
Tốc độ xử lý ứng với mật độ phương tiện (ms)
Thưa
Trung bình
Dày đặc
GMM truyền thống
17.86
17.67
17.06
Phương pháp đề xuất
6.28
9.56
16.09
Từ Bảng 2.5, có thể thấy rằng, trong cảnh với mật độ thưa và trung bình,
thời gian xử lý trung bình của phương pháp đề nghị được cải thiện đáng kể;
Trong khi mật độ dày đặc, thời gian xử lý trung bình trong kỹ thuật đề nghị đã
được cải thiện ít hơn. Lý do chính do sự thay đổi tỷ lệ học α phù hợp với sự thay
đổi ánh sáng, nên số bước lặp sẽ giảm xuống, tốc độ phát hiện nền nhanh hơn.
91
Nhận xét về phương pháp:
- Lựa chọn mô hình hỗn hợp Gauss, cải tiến việc lựa chọn tham số học để
thích nghi với sự thay đổi ánh sáng.
- Kết hợp với lưu lượng dòng quang học để phát hiện xe và đếm xe.
- Vấn đề chính là lựa chọn ngưỡng để theo dõi đối tượng (độ rộng, độ dài)
của khung bao đối tượng. Nếu chọn mức bé thì ảnh hưởng đến tốc độ tính toán,
nếu chọn lớn thì ảnh hưởng đến độ chính xác. Với ngưỡng lớn thì những đốm
sáng (lưu lượng quang học) của hai phương tiện gần nhau có thể hợp thành một,
tạo ra sự phát hiện sai.
- Một vấn đề đặt ra, thực hiện theo giải pháp này thì chưa có tính phân loại
đối tượng. Giải pháp này mới dừng lại ở việc trả lời cho câu hỏi: có bao nhiêu
đối tượng đang chuyển động trong khung hình quan tâm.
2.4. Kết luận chương 2.
Chương 2 đã trình bày và đề xuất trích chọn đặc trưng đối tượng chuyển
động theo BSM; phân tích đặc điểm từng phương pháp, rút ra để giảm bớt sự
ảnh hưởng của ánh sáng trong môi trường ngoài trời của video giao thông cần sử
dụng mô hình GMM cải tiến; trình bày phương pháp mô hình nền GMM và cải
tiến mô hình nền GMM thích nghi với sự thay đổi ánh sáng. Bao gồm:
1. Trình bày nội dung và đánh giá một số thuật toán phát hiện đối tượng
chuyển động bằng phương pháp trừ nền. Bao gồm 5 thuật toán: Thuật toán trừ
nền cơ bản; Thuật toán trừ nền trung bình; Thuật toán -; Thuật toán - cải
tiến; Thuật toán thống kê khác biệt cơ bản. Cả 5 thuật toán đều có những mặt ưu
điểm và hạn chế, tùy theo điều kiện cụ thể mà có thể áp dụng. Tuy nhiên đối với
bài toán phát hiện phương tiện chuyển động trong video giao thông, với điều
kiện ngoài trời thì cần có sự xem xét đến yếu tố tác động của thay đổi ánh sáng.
2. Đề xuất phương pháp mô hình nền GMM thích nghi với sự thay đổi ánh
sáng.
Sử dụng mô hình GMM thích nghi với tham số ánh sáng để trích chọn khối
đối tượng chuyển động phù hợp với môi trường ngoài trời, trong bài toán xác
92
định mật độ phương tiện giao thông. Việc tính toán tham số α được thực hiện là
một hàm thông qua phân tích chế độ ánh sáng , sẽ mang lại sự phản ứng của
mô hình tốt hơn về thích nghi nhanh với ánh sáng thay đổi.
Hệ số được tính thông qua công thức (2.33) và (2.34);
Hệ số α được tính theo công thức (2.38);
Trong đó i là hệ số thể hiện sự thay đổi ánh sáng (đột ngột i=1; dần dần
i=0) ở công thức (2.37);
Sự thay đổi dần dần, hay đột ngột được tính toán công thức (2.36).
3. Đề xuất phương pháp áp dụng thuật toán GMM thích nghi thay đổi ánh
sáng kết hợp luồng quang học để đếm số lượng xe chuyển động trên đường cao
tốc. Kết quả thực nghiệm cho thấy hệ thống phản ứng tốt với sự thay đổi ánh
sáng, phù hợp với điều kiện thời tiết ngoài trời.
Các kết quả được công bố tại công trình công bố số 3.
93
Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO DỰA
TRÊN ĐẶC TRƯNG HÌNH DẠNG
Chương này trình bày một số phương pháp phân loại phương tiện: Phân
loại dựa trên hình dạng; Phân loại dựa trên độ dài dựa trên cơ sở lý thuyết mômen bất biến; Phân tích và biểu diễn đường viền phương tiện trên trường số
phức; Phương pháp nhận dạng phương tiện dựa trên biểu diễn đường viền trên
trường số phức.
3.1. Phân đoạn khối phương tiện dựa trên kích thước
3.1.1. Phân tích kích thước phương tiện
Ảnh thu được từ phép trừ nền, trong đó các phương tiện có thể tạo thành
một khối, gây ra việc đếm sai, cần phải theo dõi và phân tách chúng riêng ra.
Một trong những cách giải quyết là theo dõi đối tượng chuyển động dựa trên độ
dài.
(a) ô tô con
(b) 2 ô tô dọc
(c) 2 ô tô lệch phải
(d) 2 ô tô lệch phải
(e) 1 xe máy (f) 2 xe máy trước sau (g) 2 xe máy ngang nhau
Hình 3.1. Phân tích kích thước khối xe ô tô con
Phương pháp phân đoạn và nhận dạng khối ô tô sử dụng chiều dài và chiều
rộng để phát hiện và nhận dạng các loại ô tô khác nhau từ các đối tượng trong
khối, hoặc đối tượng đơn lẻ.
94
Do chiều dài và rộng của xe thay đổi theo kiểu xe, nên phân loại sơ bộ bằng
chiều dài và chiều rộng. Nếu chiều dài của một đối tượng chuyển động là
khoảng 15-17m, chiều rộng vào khoảng 3-4m, thì đối tượng đó được phân loại
là một ô tô to như xe bus hay xe tải. Nếu chiều dài của đối tượng giữa khoảng
4,5-7,5m, chiều rộng giữa khoảng 1,4-3,0m, đối tượng chuyển động đó được
xem như xe nhỏ, ví dụ như VAN, chuyên dùng, sedan, hay xe tải nhỏ1. Sau khi
phân loại sơ bộ, phương pháp nhận dạng sẽ phân loại chính xác các xe nhỏ.
Mệnh đề 3.1. Tỷ lệ chiều dài/rộng của xe
Gọi U={ui, i=1..n} và V={vi, i=1..n} là tập chiều dài và tập chiều rộng của
xe (ô tô, xe máy), tương ứng. K={ki=ui/vi, i=1..n} là tập tỷ lệ giữa chiều dài và
chiều rộng của xe. Bộ số liệu Z=KV={zj, j=1..nn} có tính chất zizj, với
ij, (i,j [1..nn]).
Bằng thực nghiệm thống kê (Phụ lục 1) hoàn toàn có thể kiểm nghiệm
được mệnh đề trên là đúng.
Tỷ lệ chiều dài xe/rộng kết hợp với xem xét chiều rộng xe mang lại các bộ
số liệu khác nhau, có thể phân loại được loại của phương tiện (O) là xe máy
(XM), xe con (XC), xe tải (XT). Kết quả phân tích thống kê trong phụ lục 1.
Gọi: d1=[1.44 1.55] ; d2 =[0.8 1.00] ; d3=[1.451.55] ;
v1=[0.6750.740] ; v2=[1.4951.910] ; v3=[2.2402.500].
Ta có:
(
)
(
)
(
)
(
)
(3.1)
)
(
) (
{
Hình 3.11a thể hiện hình ảnh một xe con, hình 3.11g thể hiện hình ảnh của
một cặp xe máy dính khối. Trong một số trường hợp khi mà tỷ lệ cao/rộng và
chiều rộng của khối có thể nhập nhằng giữa một khối là ô tô với một khối là tập
hợp xe máy thì xác định thêm thông số diện tích của đường viền bao quanh khối.
Mệnh đề 3.2. [Diện tích đối tượng ảnh]
1
Xem “Các dạng xe” ở phụ lục 2
95
Gọi A và B là ảnh của xe một ô tô và một khối xe máy có cùng kích thước
hộp bao C(l, w) có chiều dài l và chiều rộng w, gọi DT(A) và DT(B) là diện tích
của A và B trong ảnh, tương ứng, gọi CV(A) và CV(B) là chu vi đường bao của
khối ô tô và khối xe máy tương ứng. Ta có:
( )
( )
( )
( )
(3.2)
Hình chiếu của khối ô tô lên không gian 2D gần với đa giác lồi hơn so với
hình chiếu của khối xe máy, hay nói cách khác khối xe máy trong không gian
2D có hình chiếu gần với đa giác lõm hơn. Do vậy, khi hai khối xe ô tô và xe
máy có cùng kích thước chiều dài, chiều rộng, thì tỷ lệ giữa diện tích và chu vi
của khối ô tô sẽ lớn hơn tỷ lệ của khối xe máy tương ứng (Theo tính chất của đa
giác lồi, đa giác lõm).
3.1.2. Thuật toán phân loại theo kích thước
Bắt đầu
Khối phương tiện
Tính toán tham số khối
Được
Đúng
Lớn hơn khối
đôi
Tách khối
Không
được
Sai
1 xe máy
Sai
Khối đôi
Không phân loại
1 xe con
Đúng
2 xe máy
2 xe con
1 xe tải
2 xe tải
Kết thúc
Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài
96
Thuật toán phân loại phương tiện dựa trên kích thước (CVIL)
Input:
Các khối chuyển động (kết quả thuật toán EMB)
Output: Loại phương tiện (ô tô con, ô tô tải, xe máy)
Nội dung thuật toán:
1. Trích chọn các khối chuyển động
//Sử dụng thuật toán EMB => danh sách các khối Block[i]
n=DemSoKhoi(FG)
For i = 1 to n
Block[i] = XacDinhKhoi(FG)
2. Đối với mỗi khối chuyển động Block[i], tính toán tham số
khối
For i = 1 to n {
u= ChieuDai(Block[i])
v= ChieuRong(Block[i])
}
3. Phân giải khối
- Tỷ lệ chiều dài/chiều rộng k=u/v
- Nếu thuộc khối xe máy
if (v v1){
if (k d1) XM
if (|k - Max{d1}| ≤ ) 2XM
if (|k =Max{d1}/2| ≤ ) 2XM
}
- Xử lý khi thuộc khối xe con
if (v v2) {
if (k d2) XM
if (|k - Max{d2}| ≤ ) 2XC
if (|k - Max{d2}/2| ≤ ) 2XC
}
- Xử lý khi thuộc khối xe tải
if (v v3){
if (k d3) XT
if (|k - Max{d3}| ≤ ) 2XT
97
if (|k =Max{d3}/2| ≤ ) 2XT
}
- Nếu v không thuộc v1,v2,v3 thì:
If (vv3) Phân tách khối
4. Phân tách khối
If (Phantach(Block) = True) Quay lại bước 3
else Stop.
Độ phức tạp của thuật toán CVIL:
- Độ phức tạp của thuật toán CVIL phụ thuộc chính vào thuật toán EMB,
do đó ta có độ phức tạp của thuật toán CVIL là O(NF n m).
- Sai số cho phép là giá trị sai khác về kích thước cho phép khi tính toán.
Tham số này có thể được chọn qua phương pháp thực nghiệm.
- Kỹ thuật phân tách khối liên quan nhiều đến kỹ thuật ghép biên, chia cắt
biên, nối liền biên,... được xem như là một thách thức cho bài toán nghiên cứu
tiếp tục. Một phương pháp tách khối ô tô được trình bày trong phần 3.3.
- Trong một số trường hợp cụ thể có thể dùng phương pháp máy học để
nhận dạng và phân loại trực tiếp những khối không rõ ràng này. Vấn đề này
được trình bày trong mục 3.4.
Kết quả thực nghiệm:
Hệ thống thực nghiệm được cài đặt trên môi trường Microsoft Vision
Studio 12 và thư viện mã nguồn mở EMGU. Sử dụng kết quả của thực nghiệm ở
chương 2 để xác định các khối phương tiện (ô tô). Tham số chiều rộng, chiều dài
trung bình một số loại xe của nhà sản xuất trong phụ lục 1.
Dữ liệu đầu vào sử dụng bộ dữ liệu như đã sử dụng trong thực nghiệm ở
chương 1, được thu thập thực tế tại 4 cung đường: Cao tốc Bắc Thăng Long Nội bài; Đại lộ Thăng Long; Quốc lộ 1 khu vực cầu Bò Sơn - Bắc Ninh. Mỗi
cung đường bao gồm 7 đoạn video thu thập dưới các điều kiện thời tiết khác
nhau.
98
Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL
TT
Cung đường
3
Bắc Thăng
Long
Đại lộ
Thăng Long
Quốc lộ 1
4
Quốc lộ 5
1
2
Số
khung
hình
theo dõi
(Frame)
1500
Thực hiện đếm
Xe tải
lớn
Xe tải
nhỏ
Xe
con
Xe tải
lớn
Xe tải
nhỏ
Xe
con
Tỷ lệ
chính
xác
TB
(%)
2
3
10
2
5
12
81.11
2250
2
5
14
2
6
16
90.27
1500
4
5
11
4
6
13
89.31
1650
5
8
17
5
10
21
86.98
Trực tiếp bởi người
Bằng hệ thống
Bảng 3.1 cho thấy khi giao thông đông đúc (số lượng phương tiện tăng
lên trong cùng một đơn vị thời gian) các ảnh chứa nhiều khối ô tô chồng lấp
nhau liên tiếp, độ chính xác của hệ thống giảm.
Thuật toán CVIL chỉ dựa trên hai tham số của xe đó là chiều dài và chiều
rộng của các xe đơn, xe dính khối, chưa quan tâm đến vấn đề trọng tâm và
vector khoảng cách từ tâm tới đường biên của khối. Một hạn chế nữa CVIL chưa
xét đến phân loại xe máy và tập hợp xe máy, một loại phương tiện khá phổ biến
ở Việt Nam hiện nay.
Trong phần tiếp theo, trình bày thuật toán tương tự nhưng tham khảo thêm
các tập huấn luyện tính thêm cả véc tơ khoảng cách để nhận diện thêm các
phương tiện xe máy.
3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu hình
dạng khối phương tiện
Năm 2012, nhóm nghiên cứu Wei Zhan, Junkai Yang trong công trình
nghiên cứu "Thiết kế hệ thống nhận dạng loại xe tự động, thời gian thực và ứng
dụng của nó" [25] cũng đã sử dụng kết hợp hình dạng và khoảng cách nhưng các
tác giả đã sử dụng kích thước ảnh và véc tơ hình dạng để phân loại và đếm xe.
Trên thực tế có thể dùng kích thước tính xấp xỉ để phân loại. Cách tiếp cận được
trình bày ở các mục dưới đây.
99
3.2.1. Ý tưởng phương pháp
Ảnh đối tượng chuyển động thu được từ BSM tồn tại các khối đối tượng
phương tiện chuyển động. Dùng thuật toán loại bỏ nhiễu qua xác định kích
thước khối để loại bỏ những khối nhỏ ra khỏi ảnh đối tượng. Dùng thuật toán
gán nhãn hoàn toàn có thể tách và đánh số các khối đối tượng này.
Với mỗi khối hoàn toàn xác định được độ dài, độ rộng của khối, vector
biểu diễn hình dạng của đối tượng. Gọi l, w là chiều dài, chiều rộng của khối;
gọi tập {d1, d2,...dn} là vector biểu diễn hình dạng đối tượng theo vector khoảng
cách từ tâm khối đến đường biên của khối. Tập thuộc tính của khối được xác
định là: (l, w, d1, d2,...,dn).
Nếu chỉ dựa trên tập vector khoảng cách {d1, d2,...dn} hoàn toàn có thể phân
loại được khối thuộc tập hợp phương tiện gì (xe máy; ô tô; tập hợp xe ô tô, xe
máy,...). Tuy nhiên với dựa trên tính chất độ dài, rộng (l,w) của từng khối
phương tiện, có thể kết luận nhanh khối đối tượng là khối gì.
a.Hình mẫu các dạng khối
b.Biểu diễn hình dạng khối
CSDL hình dạng
1. Thu nhận Video,
Xác định ROI,
Trích chọn khung hình,
Tìm đối khối,
Tìm khối và gán nhãn
2. Tính toán tham số khối
3. Phân giải hình dạng
4.Phân
loại
Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng
Phương pháp đề nghị phối hợp phân loại dựa trên hình dạng (hình chiếu,
trọng tâm và khoảng cách) kết hợp với phân tích độ dài, độ rộng khối đối tượng
mang lại sự phân loại nhanh chóng và chính xác, phân loại được đa dạng hơn về
chủng loại phương tiện, đặc biệt là ô tô con, xe tải, xe máy, và tập hợp các đối
tượng dính khối trong trường hợp đông đúc.
- Khối (1), xử lý theo phương pháp đề xuất ở chương 2;
100
- Khối (2), biểu diễn hình dạng theo vector khoảng cách, độ dài, độ rộng.
- Khối (3), so khớp độ dài, độ rộng ảnh và so khớp vector khoảng cách theo
các chỉ số xác định trước trong CSDL.
- Khối (a) và (b), huấn luyện các hình dạng, độ dài, độ rộng đối tượng trước
và lưu trữ vào CSDL trong hệ thống.
3.2.2. Giai đoạn chuẩn bị CSDL
Các bước tiến hành: Sưu tập hình mẫu; Xác định kích thước chiều dài,
chiều rộng; Vector hóa hình chiếu đối tượng; Đánh chỉ số Index cho các
Template trong tập mẫu đối sánh; Đưa ra một tập luật để so sánh nhanh theo
khoảng cách, kích thước khối.
Bước 1. Sưu tập hình mẫu
1 xe máy độc lập: một số loại xe như xe tay ga, xe nam, vespa,...
2,3,4,5 xe máy hợp khối theo các hình dạng khác nhau
1 xe ô tô hợp với 1,2,3,4,5 xe máy
Số mẫu sưu tập gọi là n.
Xác định kiểu hình mẫu: BlockStyle (0,1,2,3,4 tương ứng với: chưa phân
loại; 1 xe máy; 1 ô tô con; 1 xe tải; hỗn hợp xe máy và ô tô).
Bước 2. Xác định kích thước chiều dài, chiều rộng của khối
Xác định chiều rộng, chiều dài của khối (width, length)
Chuẩn hóa tỉ lệ kích thước tương ứng giữa chiều dài và chiều rộng. Ví
dụ, độ rộng của khối là 2, độ dài là 5, chuẩn hóa tỷ lệ là [0.286, 0.714].
Bước 3. Vector hóa hình chiếu đối tượng (đa giác)
Xác định số đỉnh của đa giác: m
Xác định trọng tâm của đa giác (xc, yc)
Xác định độ dài khoảng cách từ tâm tới các đỉnh của đa giác [s1,s2,...,sm]
Chuẩn hóa vector khoảng cách [d1,d2,...,dm]
Bước 4. Đánh chỉ số Index cho các Template trong tập mẫu đối sánh
Gọi tập mẫu là Template, cấu trúc của 1 Template thông qua các chỉ số,
kiểu khối, độ rộng, độ dài khối và giá trị khoảng cách tương ứng.
101
Template(Index, BlockStyle, width, length, d1,d2,...,dm)
o Index: 0,1,..., n; tương ứng với số lượng mẫu.
o BlockStyle: 0, 1, 2
Bước 5. Đưa ra một tập luật để so sánh nhanh theo khoảng cách, kích thước
khối và loại phương tiện.
Bảng số liệu thống kê một số giá trị thực về độ dài, rộng, cao của phương
tiện do các nhà sản xuất ô tô, xe máy được thu thập và thống kê trong bảng 1
(phần phụ lục).
Tập luật nhận dạng xe ô tô hay xe máy
o 1 Xe máy: Tỷ lệ cao/rộng [1.441.55], rộng [0.6750.740]
o 1 Xe con: Tỷ lệ cao/rộng [0.801.00], rộng[1.4951.910]
o 1 Xe tải: Tỷ lệ cao/rộng [1.451.55], rộng [2.2402.500]
3.2.3. Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng
Thuật toán phân loại xe VCALOS
Đầu vào: Video
Đầu ra: Loại xe/Nhóm loại xe
Các bước thực hiện:
Bước 1. Nhận dữ liệu khối đối tượng chuyển động từ giai đoạn phát hiện.
//Phát hiện khối chuyển động
Frames Trunc(Video)
Foreground EMB (Frames)
//Chỉ số hóa/gán nhãn cho các block
Block[i] Foreground
Bước 2. Đối với mỗi khối, xác định đặc tính tham số từng khối
//Tính toán tham số khối
For each Block[i] {
- Tính chiều dài Length của Block[i]
- Tính chiều rộng Weight của Block
- Tính trọng tâm của Block
- Tính chiều dài khoảng cách từ tâm tới đường biên của Block
d1, d2,..., dm
- Cập nhật thuộc tính của Block
102
Properties(i, 0, width, length, d1,d2,...,dm) Block[i]
//BlockStyle, mặc định là 0, vì chưa phân loại
}
// Cập nhật loại khối (BlockStyle)
For each Properties[i] {
- Tính tỷ lệ Height/width;
- Xác định BlockStyle qua tập luật;
Update Properties(i, BlockStyle, width, length, d1,d2,...,dm)}
Bước 3. Phân giải khối phương tiện
For each Properties[i] {
- Nếu width không thuộc v1,v2,v3 thì:
If (vv3) Chuyển bước 4
}
Bước 4. So khớp hình dạng
For each Properties[i] {
For each Template[Index] {
Compare Properties[i] ? Template[Index] Loại xe/Nhóm loại xe
}}
Return Loại xe/Nhóm loại xe
Độ phức tạp tính toán:
- Theo thuật toán EMB, thì bước 1 và 2 số phép tính ước tính tương đương
với O(NFnm), với NF là số khung hình; n là chiều dài, m là chiều rộng của
mỗi khung hình.
- Tại bước 3, kích thước tối đa của mỗi Block là một khung hình, số điểm
ảnh thuộc Block cần duyệt qua tối đa là nm ~ O(n2).
- Tại bước 4 và 5, số phép toán < O(n2).
- Tổng số phép tính ước tính: O(NFnm) + O(n2) + O(n2) ~ O(NFnm)
Kết luận, độ phức tạp ước tính của thuật toán VCALOS là O(NFnm), với
NF là số khung hình, n và m là kích thước ảnh từng khung hình.
Kết quả thực nghiệm:
103
Phương pháp thực nghiệm tương tự như đã thực hiện đối với thuật toán
CVIL. Dữ liệu cũng sử dụng lại bộ dữ liệu thu thập được như với thuật toán
CVIL. Tuy nhiên đối với các video ở cung đường Đại lộ Thăng Long, không có
phương tiện xe máy tham gia giao thông, nên không thực hiện trong thực
nghiệm.
Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS
TT
Cung
đường
2
Bắc Thăng
Long
Quốc lộ 1
3
Quốc lộ 5
1
Số
khung
hình
theo
dõi
(Frame)
1500
Thực hiện đếm
Xe
tải
lớn
Xe
tải
nhỏ
Xe
con
Xe
máy
Xe
tải
lớn
Xe
tải
nhỏ
Xe
con
Xe
máy
Tỷ lệ
chính
xác
TB
(%)
2
3
10
19
2
5
12
20
84.58
1500
4
5
11
25
4
6
13
27
90.13
1650
5
8
17
24
5
10
21
26
88.31
Trực tiếp bởi người
Bằng hệ thống
Từ kết quả Bảng 3.2 cho thấy độ chính xác trung bình tăng lên so với thuật
toán CVIL. Sự phân loại xe tải lớn về số lượng vẫn chính xác, sự biến động
nhiều vẫn nằm nhiều ở xe tải nhỏ và xe con, và đối với xe máy cũng có nhiều sự
sai số.
3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức
Đường viền của đối tượng là một đường khép kín sau khi thực hiện các
phương pháp trích chọn và xấp xỉ đường viền. Mô tả hình dạng đường viền bằng
VC trên trường số phức, đồng thời áp dụng một số tính chất của vector số phức
tương tự như tính chất của mô-men, dẫn đến khả năng so sánh và phân loại
đường viền với nhau. Từ kết quả này có thể áp dụng để tiến hành nhận dạng các
tập đường viền theo phương pháp máy học. Trước tiên huấn luyện và tạo ra 1
tập CSDL đối sánh tạo trước ở giai đoạn offline, sau đó giai đoạn online trích
đường viền ra từ khối chuyển động và so sánh, đưa ra kết luận về số lượng
phương tiện.
104
3.3.1. Sơ đồ khái quát
Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền
Phân loại dựa trên đường viền được chia thành 2 pha: Pha huấn luyện và
Pha phân loại. Sơ đồ khái quát được minh họa trong Hình 3.4. Các khối tăng
cường ảnh, tìm đường viền áp dụng các thuật toán đã có trong xử lý ảnh. Điều
quan trọng ở đây là tính toán đặc trưng của đường viền. Tuy nhiên để chuẩn hóa
đường viền ở cả pha huấn luyện cũng như pha phân loại cần phải thực hiện phép
cân bằng hóa đường viền hay còn gọi là xấp xỉ độ dài đường viền.
3.3.2. Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker
Thuật toán Douglas Peucker
Ý tưởng cơ bản của thuật toán Douglas-Peucker [29] là xét xem khoảng
cách lớn nhất từ đường cong tới đoạn thẳng nối hai đầu mút đường cong (Hình
3.5) có lớn hơn ngưỡng θ không. Nếu điều này đúng thì điểm xa nhất được giữ
lại làm điểm chia đường cong và thuật toán được thực hiện h > θ tương tự với
hai đường cong vừa tìm được. Trong trường hợp ngược lại, kết quả của thuật
toán đơn giản hoá là hai điểm đầu mút của đường cong.
105
Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker
Các bước thực hiện thuật toán Douglas-Peucker:
• Bước 1: Chọn ngưỡng θ.
• Bước 2: Tìm khoảng cách lớn nhất từ đường cong tới đoạn thẳng nối hai
đầu đoạn đường cong h.
• Bước 3: Nếu h ≤ θ thì dừng.
• Bước 4: Nếu h > θ thì giữ lại điểm đạt cực đại này và quay trở lại bước 1.
Thuật toán Douglas-Peucker:
//Hàm tính đường cao từ dinh đến đoạn thẳng nối hai điểm dau, cuoi float
Tinhduongcao (POINT dau, POINT cuoi, POINT dinh) {
floot h; || tính đường cao
returm h ;
}
//Hàm đệ quy nhằm đánh dấu loại bỏ các điểm trong đường cong
void DPSimple(POINT *pLINE,int dau,int cuoi,BOOL *chiso,float θ) {
int i, index = dau;
float h, hmax = 0;
for(i = dau + 1; i < cuoi; i++) {
h= Tinhduongcao(pLINE[dau], pLINE[cuoi]; pLINE[i]);
if(h > hmax) { hmax = h; index = i; }
}
if(hmax ≤ θ)
for(i= dau + 1; i < cuoi, i++)
chiso[i] = FALSE;
else {
DPSimple(PLINE, dau, index, chiso, θ);
DPSimple(PLINE, index, cuoi, chiso, θ) ;
}
106
}
//Hàm rút gọn số lượng điểm DouglasPeucker
int DouglasPeucker(POINT *pLINE, int n, float θ){
int i, j;
BOOL chiso [MAX_PT];
for(i = 0; i < m; i++) //Tất cả các điểm được giữ lại
chiso[i] = TRUE;
DPSimple(pLINE, 0, n – 1, chiso, θ);
for(i = j = 0; i < n; i ++)
if (chiso [i] ==TRUE)
pLINE[j++] = pLINE[i];
return j;
}
Theo [29] thì thuật toán DouglasPeucker có độ phức tạp tính toán là
O(nlog2(n)) với n là số đỉnh của đường cong cần đơn giản hóa.
Xấp xỉ độ dài đường viền
Hình 3.6. Xấp xỉ hóa đường viền
Như đã trình bày ở trên về phương pháp CA, cần xác định độ dài của
đường viền.Trong một bức ảnh thực, đường viền có độ dài bất kỳ. Do đó việc
tìm kiếm và so sánh đường viền, tất cả chúng cần có số đỉnh đồng nhất. Quá
trình này gọi là quá trình cân bằng. Đầu tiên sẽ cố định số đỉnh của VC chuẩn (ở
pha huấn luyện) sẽ sử dụng trong hệ thống nhận diện, ký hiệu là p. Sau đó với
mỗi đường viền A mới được tạo ra, ta tạo một đường viền vector N với độ dài p.
Và có thể có 2 biến thể, hoặc đường viền ban đầu có số đỉnh lớn hơn số p hoặc
nhỏ hơn số p. Nếu một đường viền ban đầu cần thiết để được sắp xếp bởi EV, ta
sẽ quan tâm tới thành phần N như tổng của các EV.
Quá trình cân bằng hóa, tương tự như quá trình thực hiện đơn giản hóa
đường cong Douglas Peucker [29] (Hình 3.6).
107
Giảm số đỉnh của đường cong:
Complex[] newPoint = new Complex[newCount];
for (int i = 0; i < newCount; i++) {
double index = 1d * i * Count / newCount;
int j = (int)index;
double p = index - j;
newPoint[i] = this[j] * (1 - p) + this[j + 1] * p;
}
Vấn đề là cần chọn giá trị p. Độ dài p lớn có nghĩa là tiêu tốn một lượng phí
lớn vào việc đánh giá. Còn giá trị p nhỏ cần ít thông tin, độ chính xác của việc
nhận dạng cũng giảm và việc nhận dạng nhiễu tăng lên.
3.3.3. Thuật toán CCAVC
CCAVC (Classification based on Contour Analysis Vector Complex)
Pha huấn luyện. Chuẩn bị cơ sở dữ liệu Template (Thực hiện thủ công).
Thuật toán huấn luyện đặc trưng phương tiện
Input:
Hình ảnh (Image),
Ngưỡng đường viền (ThresoldContour),
Số đỉnh đường viền (d)
Output:
Template(i) //Tập mẫu, số lượng mẫu tùy thuộc vào dữ liệu
thực tế trong quá trình huấn luyện
Nội dung thuật toán:
1. Chuẩn hóa về độ phân giải mong muốn
Image ChuanHoaDoPhanGiai(Image)
2. Tìm các đường viền
n SoDuongVien(Image)
Contour(i) TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền
For i=1 to n {//Áp dụng thuật toán đơn giản hóa
108
Contour(i) DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi
ChuVi(i) TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
ji
if ChuVi(i)> ThresoldContour then { Countour(j)
Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền
nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính toán tham số đặc trưng
CV(i) Chuvi(Contour(i))
DT(i)DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh
goc(i,j)=TinhGoc(Contour(i),j)
}
5. Cập nhật Template
For i=1 to m {
Template(i) Template(i) + (i, CV(i), DT(i))
For j=1 to d
Template(i) Template(i)+ goc(i,j)
}
6. Retrurn Template (i), i=1..m
______________________________________________________________
Pha phân loại. Nhận dạng trên các tập ảnh thực tế (Thực hiện online – thời gian
thực):
Thuật toán phân loại phương tiện dựa trên đường viền (CCAVC)
Classification based on Contour Analysis Vector Complex
Input: Video/Ảnh
Output: ImageCountour
(Ảnh có chứa đường viền phương tiện)
109
Nội dung thuật toán:
1. Thu nhận và Xử lý sơ bộ ảnh (Làm mịn, lọc nhiễu, tăng
độ tương phản)
Image Capture(Video)
Image ChuanHoaAnh(Image)
2. Tìm các đường viền
n SoDuongVien(Image)
Contour(i) TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền
For i=1 to n {//Áp dụng thuật toán đơn giản hóa
Contour(i) DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi
ChuVi(i) TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
ji
if ChuVi(i)> ThresoldContour then { Countour(j)
Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền
nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính toán tham số đặc trưng
CV(i) Chuvi(Contour(i))
DT(i)DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh
goc(i,j)=TinhGoc(Contour(i),j)
}
5. So sánh đường viền với Template.
For each đường viền phát hiện {
Chọn vùng chi vi để đối sánh
Chọn vùng diện tích để đối sánh
110
So sánh sự đồng dạng giữa 2 đường viền}
6. Return
Độ phức tạp thuật toán:
Giả sử bức ảnh đã được nhị phân hóa có kích thước n*n pixels, tìm đường
viền bằng cách duyệt qua toàn bộ ảnh 2 chiều, do đó độ phức tạp tương ứng là
O(n2).
Giả sử p là độ dài đường viền, t là số các đường viền có trong ảnh. Đối với
một đường viền, độ dài của nó kiểm tra thông qua phép tích vô hướng chuẩn hóa
trong tập huấn luyện và do đó mỗi đường viền chi phí hết p 2 phép so sánh.
Thuật toán so sánh đường viền có độ phức tạp ước tính là: O(n 2p2t), với n
là kích thước ảnh, t là số đường viền phát hiện được và p là độ dài đường viền.
Hạn chế của phương pháp phân tích đường viền:
- Hạn chế đầu tiên có liên quan tới vấn đề lựa chọn đường viền trên ảnh.
Đường viền được giới hạn với một cấu trúc rời rạc nhất định. Tuy nhiên các đối
tượng này được thể hiện trong môi trường thực có thể xảy ra những trường hợp:
+ Có một số lượng lớn các đường viền liên quan và không liên quan đến
đối tượng nhận dạng.
+ Đối tượng trong ảnh không thể có đường biên rõ ràng, có thể nhận diện
dựa trên độ sáng hoặc màu sắc so với nền, có thể bị nhiễu… Tất cả những nhân
tố trên dẫn tới việc đường viền không thể được lựa chọn hoặc được chọn không
chính xác, không tương đồng với đường bao của đối tượng.
- Hạn chế thứ hai, gây phức tạp cho phương pháp CA có liên quan tới các
quy tắc của phân tích đường viền. Phương pháp CA giả sử rằng đường viền mô
tả khung của các đối tượng và không quan tâm đến các phần phía sau hoặc các
phần nhìn thấy không hoàn toàn của đối tượng. Do đó CA có độ ổn định kém
trong các trường hợp nhiễu, không hỗ trợ sự giao cắt hoặc các phần nhìn thấy
của đối tượng.
111
3.3.4. Kết quả thực nghiệm
Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC
Thực nghiệm được thiết kế trên 2 dự án.
Dự án 1, ContourAnalysis, thực hiện các chức năng cơ bản của phân tích
đường viền, tạo được viền, TVH của đường viền, cân bằng hóa, đánh giá ICF và
ACF, so sánh và tìm kiếm các mẫu.
Dự án 2, ContourAnalysisProcessing , chứa các phương pháp để xử lý sơ
bộ ảnh, chọn đường viền, lọc và nhận dạng. Đồng thời nó cũng chứa các công cụ
để tự động tạo ra các mẫu cho việc nhận dạng các đường viền phương tiện. Dự
án sử dụng thư viện OpenCV (EmguCV.NET wrapper) để xử lý.
Các tham số trong thực nghiệm: Độ dài đường viền nhỏ nhất (Min contour
length) = 30; Diện tích đường viền nhỏ nhất (Min contour area) = 10; Độ phân
giải ảnh đầu vào: 640 x 480 (pixel).
CSDL mẫu: Thực hiện tạo ra một CSDL tập mẫu các đường viền gồm 30
mẫu đường viền khác nhau từ các hình dạng 1 xe máy, 1 xe ô tô, 2 xe máy, 2 ô
tô. Đường viền mẫu của xe máy được tập trung lưu trữ toàn bộ hình dạng đường
viền bao quanh xe máy. Thêm một số mẫu về đường viền phần nửa trên người đi
xe máy. Đối với ô tô, tập mẫu tạo ra bằng cách lưu trữ khung đường viền của
kính trước ô tô. (Hình 3.9).
1. Ô tô đứng độc lập
2. Hai ô tô trước sau thẳng
3. Hai ô tô trước sau lệch trái
112
4. Hai ô tô trước sau lệch phải
5. Hai ô tô ngang nhau
6. Hai ô tô ngang nhau lệch
trái
7. Hai ô tô ngang nhau lệch phải
8. Người đi xe máy chụp thẳng
9. Hai người đi xe máy trước
sau thẳng hàng
10. Hai người đi xe máy trước sau 11. Hai người đi xe máy trước 12. Hai người đi xe máy
lệch trái
sau lệch phải
ngang thẳng hàng
13. Ba người đi xe máy ngang nhau
14. Ba người đi xe máy lệch trái
15. Xe máy đi trước ô tô
Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC
113
Trong quá trình nhận dạng, gán nhãn cho đường viền phát hiện được tương
ứng là 1xm (một xe máy), 1oto (một ô tô), 2xm (hai xe máy), 2oto (hai ô tô),...
Phương pháp đã được thực nghiệm với các ảnh tự nhiên và trong bài toán
xác định mật độ phương tiện giao thông, so sánh và nhận dạng ra nhanh một xe
máy, 1 ô tô, 2 xe máy dính liền nhau, 2 ô tô dính liền nhau, 1 ô tô và 1 xe máy
dính liền nhau trong ảnh (Hình 3.9b).
a) một xe máy;
b) 2 xe máy;
c) một ô tô
Hình 3.9. Ví dụ về tập mẫu để so sánh
Dữ liệu thực nghiệm sử dụng lại bộ dữ liệu quay trực tiếp tại các điểm cầu
vượt đường cao tốc như đã trình bày trong chương 2 (Hình 2.3).
Việc kiểm nghiệm phương pháp CA bằng cách kiểm thử cho ra kết quả
80% hình dạng được nhận diện. Và kết quả này chứa một số lượng các ảnh đọc
xấu của các phương tiện. Do đó CA xử lý 249 ảnh với các kích thước khác nhau
(từ 400*400 tới 1280*960) trong vòng 30 giây.
Bên cạnh việc nhận dạng các ảnh khung hình cố định, thực hiện tốc độ cao
của CA cho phép xử lý video trong chế độ thời gian thực.
Thuật toán hoạt động với tốc độ 10-14Hz trên máy tính Pentium IV,
2.6GHz phù hợp với các ứng dụng thời gian thực. Độ chính xác của thuật toán
đã được kiểm nghiệm thông qua việc đối sánh ảnh giao thông chụp tại một số
cung đường ở Việt Nam.
114
Hướng phát triển tiếp theo là:
1) loại bỏ nhanh một số lỗi bằng cách xem xét kích thước chiều dài, chiều
rộng đối tượng, ngưỡng xấp xỉ hình dạng đường viền mịn hơn, sau đó thử
nghiệm giải thuật đối sánh ảnh trong một hệ thống giám sát giao thông thời gian
thực;
2) xem xét đến trường hợp một đối tượng có nhiều đường viền để tăng độ
chính xác và khả năng nhận dạng đối tượng đa dạng hơn.
a) Nhận dạng được 2 đường b) Nhận dạng được 3 xe máy. c) Nhận dạng được một ô tô
viền, gán nhãn cho mỗi xe 2 xe theo đường viền toàn bộ, và 1 xe máy đi gần nhau.
một nhãn là 1xm.
1 xe theo phần trên xe.
Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy
3.4. Kết luận chương 3
Trên cơ sở lý thuyết về mô-men bất biến, trong đó có các tính chất bất
biến tỷ lệ, bất biến dịch chuyển và bất biến quay áp dụng cho xử lý ảnh và nhận
dạng, phân loại đối tượng theo phương pháp hình dạng cho thấy một số đặc
trưng về hình dạng cho phép sử dụng để phân loại phương tiện giao thông như:
- Kích thước các khối đối tượng (phương tiện) trong ảnh;
- Trọng tâm và khoảng cách từ trọng tâm tới đường biên;
- Đường viền và phân tích các đặc trưng của đường viền biểu diễn trên
trường số phức để nhận dạng và phân loại.
Các phương pháp, công thức tính toán trọng tâm đa giác xấp xỉ hình dạng
đối tượng, tính độ dài khoảng cách từ tâm tới cạnh đa giác xấp xỉ; Phương pháp
đã được triển khai thực nghiệm cho kết quả phân loại được các loại xe con, xe
tải (công trình công bố số 1).
115
Đề xuất 3 thuật toán về phân loại phương tiện trong đó có ô tô và xe máy
dựa trên kích thước và hình dạng. Bao gồm:
- Thuật toán phân loại theo kích thước (thuật toán CVIL); (công bố công
trình số 1).
- Thuật toán phân loại dựa trên kết hợp độ dài và hình chiếu đối tượng
(thuật toán VCALOS). (công bố công trình số 4).
- Thuật toán phân loại dựa trên đường viền biểu diễn bằng vector số phức.
(công bố công trình số 2)
Phương pháp phân loại dựa trên CA, có khả năng ứng dụng vào các bài
toán đối sánh ảnh đòi hỏi thời gian thực. Đóng góp chính đưa ra là đề xuất sử
dụng thuật toán CA, tìm kiếm độ dài đường viền để thực hiện tìm kiếm và đối
sánh hai đường viền.
Trong điều kiện giao thông phức tạp, các đối tượng có thể chồng lấp, nối
đuôi nhau hoặc sánh ngang nhau, hoặc so le nhau tạo thành những đường viền
phức tạp, việc áp dụng phương pháp CA gặp phải những khó khăn.
116
KẾT LUẬN
I. Các kết quả chính của luận án
Kết quả nghiên cứu của luận án được trình bày trên 121 trang, cấu trúc chia
thành 3 chương nội dung chính, phần mở đầu, phần kết luận, tài liệu tham khảo
và phụ lục.
Về phát hiện phương tiện chuyển động, luận án đã trình bày về 05 thuật
toán phát hiện đối tượng chuyển động bằng phương pháp trừ nền; phân tích và
đưa ra những ưu khuyết điểm từng phương pháp, phân tích và đưa ra yêu cầu
của mô hình hóa nền đối với video giao thông; đề xuất mô hình GMM thích ứng
với sự thay đổi ánh sáng; áp dụng mô hình đề xuất trong thực nghiệm hệ thống
đếm xe trên đường cao tốc.
Về phân loại phương tiện chuyển động, luận án phân tích và đưa ra các đặc
trưng quan trọng của hình dạng để áp dụng cho việc phân loại phương tiện giao
thông đó là: kích thước đối; các đặc trưng hình dạng như đa giác xấp xỉ phương
tiện, trọng tâm và khoảng cách từ tâm đến cạnh đa giác; chu vi đường viền.
Luận án đã phân tích và xây dựng thuật toán phát hiện đối tượng chuyển
động bằng mô hình GMM thích ứng thay đổi ánh sáng (chương 2); thuật toán
phân loại phương tiện dựa trên kích thước và hình dạng, thuật toán phân tích
đường viền phục vụ cho nhận dạng (chương 3).
Các kết quả phân tích và thực nghiệm một số thuật toán được công bố trong
04 bài báo trên các tạp chí chuyên ngành và hội nghị khoa học về công nghệ
thông tin.
Nội dung của luận án đề cập và các kết quả được công bố phù hợp và đáp
ứng được mục tiêu luận án đề ra.
II. Những đóng góp mới
Luận án với 03 đóng góp chính:
Cải tiến mô hình GMM thích ứng với sự biến đổi ánh sáng, bằng việc
thêm tham số để ứng phó với việc thay đổi ánh sáng trong môi trường
117
thực. Kết hợp mô hình nền GMM thích ứng thay đổi ánh sáng và
luồng quang học để giải quyết việc xác định mật độ xe ô tô cải thiện
tốc độ tính toán và tăng độ chính xác trong trường hợp giao thông trên
các đường cao tốc ở Việt Nam.
Đề xuất phương pháp phân loại kết hợp giữa phân tích hình dạng đối
tượng và độ dài của đối tượng. Phương pháp nhận dạng và phân loại
nhanh dựa trên cơ sở phân tích và lập chỉ mục theo các tham số đặc
trưng loại, độ dài, độ rộng.
Đề xuất phương pháp phân loại dựa trên phân tích đường viền. Trích
chọn đặc trưng đường viền, biểu diễn trên trường số phức, tiến hành
phân loại dựa trên độ dài và hình dáng đường viền.
III. Hướng nghiên cứu tiếp theo
Mặc dù, tất cả các đề xuất trong nghiên cứu này có thể làm việc tốt trong
một số trường hợp, các mô hình vẫn còn dễ bị lỗi và tốn thời gian. Các nghiên
cứu trong tương lai có thể kiểm tra chi tiết cấu trúc không gian của khu vực quan
sát; áp dụng trong học máy, được gọi là học cao cấp; xem xét trường hợp nhiều
đường viền tích hợp trên một đối tượng. Đây có thể là một hướng đi mới để phát
triển các hệ thống giám sát đối tượng chuyển động trên máy tính với độ chính
xác cao và tỷ lệ sai số thấp.
118
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ
1.
Nguyễn Văn Căn, Vũ Tuấn (2013), “Giám sát giao thông tự động dựa trên độ
dài thị giác”. Tạp chí Khoa học và Công nghệ quân sự. Số 5/2013, trang 69-81.
2.
Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm Việt Trung (2014), “Phương pháp
biểu diễn đường viền trên trường số phức, áp dụng cho bài toán phân loại
phương tiện giao thông”. Tạp chí Khoa học và Công nghệ quân sự. Số 10/2014,
trang 58-65.
3.
Can Nguyen Van, Huy Huynh Van, Tao Ngo Quoc (2014), “Car counting
method using Gaussian Mixture Model and Optical Flow”. The 3rd Solid State
Systems Symposium-VLSIs and Semiconductor Related Technologies & The
17th International Conference on Analog VLSI Circuits-Analog Signal and
Information Processing Applications. Ho Chi Minh City, 10/2014. Proceeding,
pages 192-198.
4.
Can Nguyen Van, Cuong Nguyen Ngoc (2014), “Vehicle Classification in Video
Based on Shape Analysis”. UKSim-AMS 8th European Modelling Symposium on
Mathematical Modeling and Computer simulation Proceeding EMS '14
Proceedings of the 2014 European Modelling Symposium. IEEE Computer
Society Washington, DC, USA ©2014. ISBN: 978-1-4799-7412-2, pages 151157. (http://dl.acm.org/citation.cfm?id=2706693.2706789).
119
TÀI LIỆU THAM KHẢO
Tiếng Việt:
[1]
Phạm Hồng Quang, Tạ Tuấn Anh (2014), Xây dựng cấu trúc hệ thống giao thông
thông minh và các quy chuẩn công nghệ thông tin, truyền thông, điều khiển áp
dụng trong hệ thống giao thông thông minh tại Việt Nam. Đề tài KC01.14/11-15.
Trung tâm Tin học và Tính Toán, Viện Hàn lâm KHCN Việt Nam.
[2]
Phạm Hồng Quang (2014), Xây dựng mạng camera với hệ thống xử lý hình ảnh
thông minh phục vụ điều khiển giao thông và giám sát an ninh. KC03.DA06/1115. Công ty Cổ phần Phần mềm - Tự động hóa - Điều khiển.
[3]
Trần Thanh Việt, Trần Công Chiến, Huỳnh Cao Tuấn, Nguyễn Hữu Nam, Đỗ
Năng Toàn, Trần Hành (2011), Một kỹ thuật bám đối tượng và ứng dụng. Kỷ yếu
hội thảo quốc gia lần thứ XIV, Cần Thơ, 10/2011. Nhà Xuất bản Khoa học và Kỹ
thuật. Trang 238-247.
Tiếng Anh:
[4]
Ahmed Elgammal (2010), Computer Vision 3D Model-based recognition. Dept
of Computer Science, Rutgers University.
[5]
Amol A. Ambardekar (2007), Efficient Vehicle Tracking and Classification for
an Automated Traffic Surveillance System, A thesis submitted in partial
fulfillment of the requirements for the degree of Master of Science in Computer
Science.
[6]
Chee-Way Chong and at al (2004), Translation and scale invariants of Legender
moments, Pattern Recognition (Vol 37), pp.119-129.
[7]
Chung-Cheng Chiu and et al (2010), Automatic Traffic Surveillance System for
Vision-Based Vehicle Recognition and Tracking. Department of Electrical and
Electronic Engineering, Chung Cheng Institute of Technology National, Defense
University Taoyuan, Taiwan.
[8]
Clement Chun Cheong Pang and at al (2007), A Method for Vehicle Count in the
Presence of Multiple-Vehicle Occlusions in Traffic Images, IEEE transactions on
intelligent transportation systems, (Vol. 8, No. 3).
[9]
Collins R. T. (2000), A system for video surveillance and monitoring: VSAM
final report, Technical report (CMU-RI-TR-00-12), Robotics Institute, Carnegie
Mellon University.
[10] Cucchiara R. (2000), Statistic and Knowledge-based Moving Object Detection in
Traffic Scenes. D.S.I. University of Modena.
[11] George S.K. Fung and at al (2001), Vehicle Shape Approximation from Motion
for Visual Traffic Surveillance. IEEE Intelligent Transportation Systems
Conference Proceedings, USA.
[12] Guohui Zhang and et al (2007), A Video-based Vehicle Detection and
Classification System for Real-time Traffic Data Collection Using Uncalibrated
120
Video Cameras, Department of Civil and Environmental Engineering University
of Washington.
[13] Hu M. K. (1962), Moments and Moment Invariants in Pattern Recognition, IRE
Trans. Info. Theory (vol.IT-8), pp.179–187.
[14] Jean-Yves Bouguet (2002), Pyramidal Implementation of the Lucas Kanade
Feature Tracker Description of the algorithm, Intel Corporation, Microprocessor
Research Labs.
[15] Lai A. H. S. (2000), An effective methodology for visual traffic surveillance,
Hong Kong University.
[16] Lipton A. J. (1999), Moving target classification and tracking from real-time
video. In Proc. of Workshop Applications of Computer Vision, pages 129-136.
[17] Massimo Piccardi (2004), Background subtraction techniques: a review,
Computer Vision Research Group (CVRG), University of Technology, Sydney
(UTS).
[18] Nilesh J. Uke (2013), Moving Vehicle Detection for Measuring Traffic Count
Using OpenCV, Journal of Automation and Control Engineering (Vol.1, No.4).
[19] Nikolaos P. (2000), Algorithms for Vehicle Classification, Artificial Intelligence,
Robotics and Vision Laboratory, University of Minnesota.
[20] Sagar Deb (2005), Video data management and information retrieval. University
Southem Queensland, Australia.
[21] Shireen Y. Elhabian (2007), Moving Object Detection in Spatial Domain using
Background Removal Techniques - State-of-Art, Cairo University, Egypt.
[22] Sigari M., Fuzzy Running Average and Fuzzy Background Subtraction: Concepts
and Application, International Journal of Computer Science and Network
Security, 2008, Volume 8, No. 2, pages 138-143.
[23] Stauffer C. (1999), Adaptive background mixture models for real-time tracking,
Technical report (CVPR 1999), pages 246-252.
[24] Thierry Bouwmans (2013), Recent Advanced Statistical Background Modeling
for Foreground Detection - A Systematic Survey, Laboratoire MIA, Université de
La Rochelle, France.
[25] Wei Zhan, Junkai Yang (2012), Real Time and Automatic Vehicle Type
Recognition System Design and Its Application, International Conference on
Mechanical Engineering and Automation.
[26] Yigithan Dedeoglu (2004), Moving object detection, tracking and classification
for smart video surveillance, Univeristy of Bilkent.
[27] Xue Mei and at al (2007), Integrated Detection, Tracking and Recognition for IR
Video-based Vehicle Classification, Journal of computers (Vol.2, No.6).
[28] Yu-Kumg Chen, Tung-Yi Cheng, Shuo-Tsung Chiu (2009), Motion Detection
with Using Theory of Entropy. IEEE International Symposium on Industrial
Electronics (ISlE 2009).
121
[29] Wu, Shin-Ting and Márquez (2004), Mercedes R. G (2004), A non-selfintersection Douglas-Peucker Algorithm, Proceedings of Sibgrapi. © 2004 IEEE.
[30] Jitendra Malik, Serge Belongie, Thomas Leung, Jianbo Shi (2001), Contour and
Texture Analysis for Image Segmentation. International Journal of Computer
Vision, June 2001, Volume 43, Issue 1, pp 7-27.
[31] Rohit Kolar, Akshay Thakar, Muzaffar Shabad (2014), Image Segmentation for
Text Recognition using Boundary Analysis. International Journal of Emerging
Technology and Advanced Engineering. ISSN 2250-2459, ISO 9001:2008
Certified Journal, Volume 4, Issue 2, February 2014) 294.
[32] Corentin Lallier, Emanuelle Reynaud, Lionel Robinault, Laure Tougne (2011), A
Testing Framework for Background Subtraction Algorithms Comparison in
Intrusion Detection Context. 8th IEEE International Conference on Advanced
Video and Signal-Based Surveillance.
[33] Andrews Sobral, Antoine Vacavant (2014), A comprehensive review of
background subtraction algorithms evaluated with synthetic and real videos.
Computer Vision and Image Understanding 122.
[34] A. Vacavant, T. Chateau, A. Wilhelm, L. Lequièvre (2012), A benchmark
dataset for foreground/background extraction, in: Background Models
Challenge (BMC). Asian Conference on Computer Vision (ACCV), LNCS, vol.
7728, Springer, 2012, pp. 291–300.
[35] Y. Dhome, N. Tronson, A. Vacavant, T. Chateau, C. Gabard, Y. Goyat, D.
Gruyer (2010), A benchmark for background subtraction algorithms in
monocular vision: a comparative study. IEEE International Conference on
Image Processing Theory, Tools and Applications (IPTA), 2010, pp. 66–
71.
[36] A. Sobral (2013), BGSLibrary: an opencv c++ background subtraction
library. IX Workshop de Viso Computacional. Rio de Janeiro, Brazil.
[37] Jean Dieudonné (1960), Foundations of Modern Analysis, Academic Press.
1
PHỤ LỤC
Phụ lục 1. Dữ liệu kích thước các loại xe
Nguồn: Internet, Đơn vị tính: mm
TT
1
2
3
4
5
6
7
8
9
Xe ô tô
Xe con Toyota Camry 2.5Q AT
Xe con Chevrolet Spark Van
Xe tải Hyundai JAC 1T5
Xe tải Hyundai JAC 1T8
Xe tải Hyundai JAC 1T95
Xe tải HINO - WU422L
Xe tải HINO - FC9JJSA 6T2
Xe tải HINO - FG8JPSB 9T2
Xe tải HINO - FL8JTSL 16T
TT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Xe máy
Honda Future
Yamaha Sirius
DaeHan Exciter GP
Honda SH 150i và SH 125i
Honda Lead 125cc Fi
Suzuki Hayate 125
Suzuki Hayate SS 125 FI
Honda Wave 110 S Deluxe
Honda SH125 Mode
Honda Wave Alpha
Honda Air Blade Fi 125cc
Honda Vision 110cc Fi
Suzuki X-Bike 125
Honda Lead 110cc
SYM Attila Elizabeth EFI
Yamaha Nouvo SX RC
Yamaha Exciter
Honda Wave 110 RSX
Suzuki Smash Revo 110
Honda SH150i
Suzuki X-Bike 125
Honda Future 125 FI
Yamaha Luvias GTX125 Fi
Honda Super Dream
Suzuki Smash Revo
HONDA SCR
Sym Shark 170cc
Yamaha Nozza
Dài
4825
3495
5480
5710
5710
7160
8250
9550
11450
Rộng
1825
1495
1940
1865
1910
2240
2400
2500
2500
Cao
1470
1500
2140
2210
2250
3270
3680
3950
3930
Cao/rộng
0.805479
1.003344
1.103093
1.184987
1.17801
1.459821
1.533333
1.58
1.572
Dài
1932
1890
1776
2034
1832
1935
1925
1925
1930
1910
1901
1841
1905
1835
1795
1955
1960
1898
1920
2020
1905
1932
1855
1915
1920
1830
2090
1795
Rộng
711
675
697
740
680
670
660
710
669
700
670
667
715
670
668
705
695
709
655
700
715
711
700
696
655
681
730
685
Cao
1092
1030
1005
1152
1120
1070
1070
1090
1105
1065
1115
1094
1070
1125
1100
1080
1080
1080
1050
1140
1070
1092
1070
1052
1055
1125
1160
1080
Cao/rộng
1.535865
1.525926
1.441894
1.556757
1.647059
1.597015
1.621212
1.535211
1.651719
1.521429
1.664179
1.64018
1.496503
1.679104
1.646707
1.531915
1.553957
1.523272
1.603053
1.628571
1.496503
1.535865
1.528571
1.511494
1.610687
1.651982
1.589041
1.576642
2
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
Honda Click Forward 125i
Suzuki UA 125T Fi
Honda CBR150R
Suzuki GZ150–A 150cc
Yamaha Luvias GTX
Honda Click 125i Idling
Yamaha Cuxi
Suzuki Axelo 125
Suzuki Viva 115 Fi
Honda Scoopy FI Club
Honda Spacy 125
SYM Joyride EFI
Piaggio Liberty RST 125
Yamaha Mio Classico
Honda Mojet 125
Honda Taranis 110 TQuốc
Honda PCX
SYM ElegantSR
Suzuki EN150-A
Honda Scoopy i S12
Kymco Candy 50cc
Kymco Candy Hi 110cc
Honda Super Cub 110
Honda Giorno 50cc Fi
Honda PS150i
Suzuki SkyDrive 125
Honda Diamond Blue 125
Nhỏ nhất
Lớn nhất
Trung bình
1904
1860
1977
2250
1850
1919
1750
1895
1910
1856
1795
1900
1935
1830
1814
1890
1917
1910
2055
1856
1815
1820
1915
1685
1990
1900
1800
689
700
695
900
685
689
635
715
690
694
690
680
760
675
675
680
738
680
730
694
675
680
700
650
700
655
733
1103
1095
1130
1160
1060
1103
1055
1075
1085
1060
1070
1100
1120
1040
1100
1110
1094
1100
1050
1060
1108
1100
1050
1035
1150
1050
1150
1.600871
1.564286
1.625899
1.288889
1.547445
1.600871
1.661417
1.503497
1.572464
1.527378
1.550725
1.617647
1.473684
1.540741
1.62963
1.632353
1.482385
1.617647
1.438356
1.527378
1.641481
1.617647
1.5
1.592308
1.642857
1.603053
1.568895
1685
635
1005 1.288889
2250
900
1160 1.679104
1897.436 695.0182 1088.182 1.568584
3
Phụ lục 2. Một số kiểu xe ô tô
(Nguồn thu thập trên Internet)
1. VAN:
Van là một loại xe tải nhỏ, khoang chở người và trở hàng chung một không
gian kín. Loại xe này có đặc điểm là khi không trở người các hàng ghế sau có
thể gập lại thành khoang chứa hàng. Cửa bên thông thường là cửa lùa tạo điều
kiện hoạt động trong không gian hẹp. Vì là loại xe có tải trọng thường chỉ từ 500
– 1.000 kg nên công suất không lớn. Ở Việt Nam dòng xe VAN (thực chất là
minivan) có khá nhiều, có thể nêu lên một vài loại xe mang tên VAN sau đây:
Xe Daihatsu Citivan – có hình dáng mẫu mã rất bắt mắt, kết hợp hài hoà tính
năng dòng xe du lịch với xe VAN.
Xe Daihatsu Citivan lắp động cơ xăng kiểu HD-C có dung tích công tác 0,6
lít, xi-lanh thẳng hàng, 6 xu- páp bố trí trục cam kiểu SOHC. Mô men xoắn Nm,
5 số tay. Số ghế: 7. Hai cửa lùa bên hông, cửa sau mở lên. Hàng ghế thứ. tháo
lắp dễ dàng để tạo khoang chứa hàng hoá.
Ngoài Daihatsu Citivan ra, loại xe Devan chở hàng thùng kín, cửa lùa bên
hông cũng lắp động cơ HD-C cùng loại với Citivan.
Loại xe Toyota Hiace Glass VAN. Đây là dòng xe VAN cao cấp, hàng ghế
sau gập lại rất dễ tạo khoang hàng rộng rãi. Hai cửa hông là loại cửa lùa, cửa sau
mở bằng khí nén.
Xe Hiace Glass VAN dùng động cơ phun xăng điện tử. Hộp số 5 số tay.
Hai điều hoà nhiệt độ.
Loại xe SUZUKI Super Carry VAN. Đây là loại xe nhỏ nhất hiện đang sử
dụng ở nước ta, xe SUZUKI VAN có hai loại: xe khách 7 chỗ Windowvan và xe
tải cửa lùa Blindvan. Hai loại xe trên đều dùng động cơ xăng F.0A, xi-lanh
thẳng hàng, dung tích công tác 70cm. Mômen xoắn 75Nm. Hộp số 5 số tay. Số
ghế 7. Hai hàng ghế sau có thể gập lại để tạo khoang chứa hành lý.
2. SUV
4
SUV được EuroNCAP xếp vào nhóm xe địa hình loại lớn. SUV khá quen
thuộc hơn với thị trường Việt Nam với các model như Mitsubishi Pajero, Toyota
Land Cruiser, Mercedes-Benz M-Class. SUV là loại xe dẫn động 4 bánh (còn
gọi là xe hai cầu) có thể chạy trên nhiều loại địa hình, có hệ thống treo cao.
Trọng tâm cao là một điểm bất lợi của loại xe này vì làm cho nó dễ bị lăn khi
chẳng may gặp tai nạn. Vì thiết kế lớn hơn nên SUV cũng sử dụng nhiều nhiên
liệu hơn.
3. Sedan
Sedan là một loại xe khách mà thân xe đại thể chia làm ba khoang:
khoang động cơ, khoang hành khách và khoang hành lý. Ở Anh, người ta gọi
loại xe này là xe saloon. Khoang hành khách thường gồm hai dãy ghế. Khoang
động cơ thường ở phía trước. Còn khoang hành lý thường ở phía sau. Cũng có
một số xe sedan mà khoang động cơ lại ở phía sau như Renault Dauphine, Tatra
T613, Volkswagen Type 3 và Chevrolet Corvair. Sedan là loại thân xe khách
phổ biến nhất.
[...]... tích và biểu diễn đặc trưng phù hợp để đề xuất và áp dụng thuật toán phân loại phương tiện chuyển động + Trên cơ sở phân tích tập thuật toán, đề xuất sự cải tiến, kết hợp các thuật toán cho mục đích phát hiện, phân loại phương tiện giao thông trong điều kiện giao thông đông đúc và đa dạng về chủng loại phương tiện 3 Đối tượng và phạm vi nghiên cứu Vấn đề "Nghiên cứu phát triển một số thuật toán phát hiện. .. cải tiến một số thông số kỹ thuật trong thuật toán mang lại lợi ích cho việc phát hiện và phân loại phương tiện giao thông trong bối cảnh Việt Nam là điều cần thiết có ý nghĩa cả về lý thuyết và thực tiễn Bài toán phát hiện và phân loại phương tiện giao thông dựa trên video là xét xem tại một thời điểm, trong vùng quan tâm, có những loại phương tiện gì, số lượng tương ứng Về ứng dụng, bài toán thuộc... bài toán, phương pháp tiếp cận, phạm vi nghiên cứu, những thách thức đặt ra cho bài toán, hướng nghiên cứu, ý nghĩa khoa học, ý nghĩa thực tiễn của bài toán nghiên cứu Chương 1 Tổng quan về bài toán phát hiện và phân loại phương tiện trong video giao thông Đặt vấn đề về bài toán nghiên cứu; trình bày kết quả của một số nghiên cứu liên quan Đề xuất vấn đề nghiên cứu của luận án Chương 2 Trình bày phương. .. nhận dạng, phân loại phương tiện trong ảnh; Áp dụng một số tính chất của đường viền vector để phân loại phương tiện dựa trên độ dài và hình dáng đường viền dựa trên đối sánh ảnh Phần kết luận Trình bày những đóng góp và hướng nghiên cứu phát triển tiếp theo của luận án 8 Chương 1 TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO Chương này trình bày một số phương pháp, kỹ thuật xử... tập trung vào việc nghiên cứu một số thuật toán phát hiện và phân loại đối tượng chuyển động trong vùng quan tâm; giải quyết vấn đề ô tô, xe máy trong video giao thông mà lưu lượng giao thông đông đúc ("dày đặc") có sự và "dính nhau" trong điều kiện Việt Nam 4 Phương pháp nghiên cứu Thu thập và nghiên cứu tài liệu về các nghiên cứu đã thực hiện trên thế giới và Việt nam về vấn đề giám sát thông minh... Đối tượng nghiên cứu của luận án gồm: Bài toán phát hiện, theo dõi và phân loại đối tượng chuyển động; Các công trình đã và đang nghiên cứu trong và ngoài nước về vấn đề phát hiện, theo dõi và phân loại đối tượng chuyển động; Các thuật toán, phương pháp đã áp dụng trong vấn đề này Các đoạn video quay cảnh giao thông Tổng quát lại, đây là một phạm vi rộng, bao gồm: phát hiện, phân loại và theo dõi đối... rất nhiều khó khăn Nhiều nghiên cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề phát hiện và phân loại phương tiện giao thông, tuy nhiên chưa có nghiên cứu đầy đủ nào quan tâm đến mức độ dày đặc của phương tiện trên đường, cũng như quan tâm đặc biệt đến phương tiện giao thông chủ yếu là xe máy và xe ô tô Việc lựa chọn phương pháp, thuật toán, hay phối kết hợp các thuật toán sử dụng trong hệ thống... hiện và phân loại phương tiện từ dữ liệu video giao thông được thực hiện chủ yếu trên môi 5 trường ngoài trời Dữ liệu video giao thông có thể thu được từ những cung đường khác nhau: từ các cung đường nông thôn (quận, huyện), từ các đường quốc lộ (cao tốc), từ các đường trong đô thị (thành phố) Trong điều kiện ở Việt Nam hiện nay, việc gắn các camera giao thông của các cơ quan quản lý và điều khiển giao. .. ngoài và bên trong phương tiện là những đặc trưng quan trọng trong việc phân loại phương tiện Sử dụng một đặc trưng, hoặc kết hợp 2 hay nhiều đặc trưng và một số kỹ thuật liên quan để phân loại phương tiện là rất hiệu quả Yếu tố ảnh hưởng đến phương pháp tiếp cận: Về màu sắc phương tiện thay đổi liên tục theo thời gian, thêm vào đó có nhiều loại phương tiện có màu sắc tương đồng nhau, do vậy việc phân loại. .. tiêu nghiên cứu của luận án - Mục tiêu chung: Từ dữ liệu video thu được từ các đường quốc lộ, tìm một số thuật toán hợp lý để phân loại và xác định phương tiện chuyển động - Mục tiêu cụ thể: + Lựa chọn và cải tiến phương pháp phát hiện phương tiện chuyển động phù hợp với môi trường ngoài trời, chịu tác động nhiều của sự thay đổi ánh sáng + Trích chọn các đặc trưng của phương tiện chuyển động, phân ... chủng loại phương tiện Đối tượng phạm vi nghiên cứu Vấn đề "Nghiên cứu phát triển số thuật toán phát phân loại phương tiện từ liệu video giao thông thực chủ yếu môi trường trời Dữ liệu video giao. .. GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN CĂN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN TỪ DỮ LIỆU VIDEO GIAO THÔNG Chuyên... thuật toán phân loại phương tiện chuyển động + Trên sở phân tích tập thuật toán, đề xuất cải tiến, kết hợp thuật toán cho mục đích phát hiện, phân loại phương tiện giao thông điều kiện giao thông
Ngày đăng: 19/10/2015, 10:16
Xem thêm: Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông, Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông