041_Sử dụng mô hình Maximum Entropy nhận dạng màu da ảnh màu

4 528 1
041_Sử dụng mô hình Maximum Entropy nhận dạng màu da ảnh màu

Đang tải... (xem toàn văn)

Thông tin tài liệu

- 50 - SỬ DỤNGHÌNH MAXIMUM ENTROPY NHẬN DẠNG MÀU DA ẢNH MÀU Nguyễn Tuấn Nghĩa MSV: 0122006 Email: nghiak46cb@yahoo.com Người hướng dẫn: ThS.Đào Kiến Quốc 1. Tổng quan Xây dựng hai hình nhận dạng màu da ảnh màu với ràng buộc lấy từ tập cơ sở dữ liệu Compaq. Mỗi hình sử dụng entropy cực đại, hình đầu tiên là hình Baseline, xem các pixel là độc lập với nhau. hình thứ hai là một hình Markov ẩn (HHM), nó thêm vào ràng buộc hai điểm lân cận nhau có quan hệ xuất hiện màu da và không phải màu da. Cả hai hình đánh giá xác suất mộ t giá trị màumàu da p(y s |x), nếu xác suất này cao hơn một ngưỡng thì giá trị màu đó là màu da và ngược lại. 2. Giới thiệu 2.1. Định nghĩa Dò màu da là tìm kiếm trên các pixel màu da của một ảnh màu. Kết quả là một ảnh nhị phân cùng kích cỡ, trong đó màu trắng là da, màu đen là không phải màu da hay còn gọi là nền. 2.2. Phương thức Mô hình entropy cực đại là một phương thức suy ra hình thống kê từ tập cơ sở dữ liệu. Nó th ực hiện như sau: 1) Trích chọn đặc trưng 2) Áp đặt các ràng buộc cho hình 3) Xây dựng hình phân phối có điều kiện p(y|x) 4) Thiết lập tham số hình 5) Sử dụng lược đồ để phân lớp màu da và không phải màu da. Nhiệm vụ 1,2) chỉ ra các đặc trưng và áp đặt ràng buộc với tập quan sát từ CSDL Compaq 3) khi entropy đạt cực đại, chúng ta có thể tính được phân phối p(y|x) 4) xây dựng tham số cho hình bằng các đặ c trưng địa phương 5) bằng cách chọn mẫu theo thuật toán lấy Gibbs, sử dụng mẫu này tính p(y s |x). 3. Mô hình entropy cực đại 3.1. Một số ký hiệu Gọi tập các giá trị màu là S, giá trị màu tại pixel s là x s , màu da (skinness) của pixel s là y s với y s = 1 nếu s là pixel màu da và y s = 0 nếu y s không phải màu da. Ảnh màu là được xem là một vector của các pixel màu, được ký hiệu là x và ảnh nhị phân tương ứng được tạo nên bởi các màu da y s là y. Giả sử biết được phân phối đồng thời của vector p(x,y), theo công thức Bayes sẽ tính được phân phối hậu nghiệm p(y|x). Mục tiêu cuối cùng là tính xác suất một giá trị là màu da p(y s =1|x s ) từ phân phối hậu nghiệm. Nhưng chúng ta không biết được phân phối p(x,y) thay vào đó, có thể sử dụng CSDL Compaq. Nó là tập mẫu: {(x (1) ,y (1) ),(x (2) ,y (2) ),…,(x (n) ,y (n) )} trong đó 1 ≤ i ≤ n=18.696, x (1) là một ảnh màu, y (1) là ảnh nhị phân tương ứng, các mẫu là độc lập với nhau và có xác suất phân phối p(x,y). Tập các mẫu cũng được xem như tập dữ liệu học. Xác suất được thiết lập bởi các thiết lập kinh nghiệm và được ký hiệu bởi q. Sau đây, trình bày tóm tắt cách xây dựng hình phân phối xác suất màu da với của một ảnh màu p(y|x). 3.2. hình Baseline Xây dự ng hình tương ứng ràng buộc một pixel bởi dữ liệu Compaq: - 51 - C 0 : ∀ s ∈ S, ∀ x s ∈ C, ∀ y s ∈ {0,1}, p(x s ,y s ) = q(x s ,y s ) Trong đó q(x s ,y s ) là tỉ lệ pixel với màu x s và skinness y s , trong tập dữ liệu học. Theo công thức nhân Larange khi hình đạt entropy cực đại, ta có: p(y|x) = ∏ s∈S q(y s |x s ) (1) trong đó: q(y s |x s ) = ss 1 (|y)(y) () s s qx q qx với q(x s ) = 1 ss ys=0 (|y)q(y) s qx ∑ Chúng ta tính biểu thức trên bằng hai lược đồ q(x s |y s = 1) và q(x s |y s = 0) tương ứng cho phân phối của các pixel màu da và không phải màu da. 3.3. hình Markov ẩn (HMM) hình Baseline không có được nhiều chặt chẽ, thực tế cho thấy các vùng da không đơn thuần phân phối ngẫu nhiên mà nó được cấu tạo nên bởi các vùng da rộng. Vì vậy, tăng cường khả năng nhận dạng bằng cách ràng buộc thêm xác suất xuất hiện màu da cho tất cả cặp điểm lân cận nhau. Trong HMM, sử dụng hệ thống 4 lân cận (là lưới các pixel mà xung quanh mỗi pixel có 4 pixel lân cận), theo dõi màu da của hai điểm lân cận s, t: (y s = a, y t = b), khả năng xảy ra đồng thời màu da hay không phải màu da p(a,b) với a = 0,1 và b = 0,1 tương ứng là ràng buộc thuộc tập học. Giả sử rằng hình MaxEnt là đẳng hướng theo hai hướng ngang và dọc, có nghĩa rằng q(y s ,y t ) = q(y s' ,y t' ) theo cùng một hướng. Ràng buộc HHM như sau: D: ∀s ~ t ∈ S x S, p(y s = 0, y t = 0) = q(0, 0) và p(y s = 1, y t = 1) = q(1, 1). hình MaxEnt trong không gian C 0 ∪ D theo phân phối Gibbs là: p(y|x) = ∏ ∈Ss ss yxq xp yp )|( )( )( (2) với p(y)= 0s t st 01 s~t 1 exp ( (1 y )(1 - y) 1 y) (,) () aay Za a −+ ∑ (3) , Z(a 0 ,a 1 ) = 0s t st ys~t exp ( (1 y )(1 - y) 1 y) () aay−+ ∑∑ (4) Hàm Z(a 0 ,a 1 ) là hàm phân hoạch để đảm bảo ràng buộc thỏa mãn. 3.4. Thiết lập tham số Đối với hình Baseline, có thể dễ dàng tính phân phối p(y|x), tuy nhiên với HMM cần thiết phải thiết lập hai tham số a 0 và a 1 để thỏa mãn ràng buộc. Thiết lập tham số có thể dùng cách tính xấp xỉ, chúng ta sẽ thuật toán Metropolis lấy mẫu thỏa mãn (3) mà không cần biết a 0 và a 1 , sau đó, dùng mẫu này để tính hai tham số theo công thức sau: p(Y s =1|y (s) ) = 10 0 (( ) (1) 4 ) s aan a φ +− Trong đó hàm n s (1) số các giá trị y t = 1, t~s, rõ ràng hàm này chỉ nhận 5 giá trị {0,1,2,3,4}. Và tương ứng với mỗi giá trị của n s (1), giá trị p(Ys=1|y (s) ) có thể thiết lập được từ ảnh mẫu, có nghĩa chúng ta phải chỉ ra 5 biểu thức tuyến tính để tính a 0 và a 1 . Kết quả a 0 =3,76 và a 1 =3,94. Bây giờ các tham số đã có, nhiệm vụ cuối cùng cho một ảnh màu x tìm ảnh y nhị phân, với màu trắng là da, màu đen không phải là da. 3.5. Nhận dạng màu da Với một ảnh đầu vào, nhận dạng màu da yêu cầu phải tính p(y s |x) là xác suất tại pixel s là màu da. Với hình Baseline, chỉ cần thay y s =1, x s vào (1), có thể tính được xác suất giá trị màu x s là màu da. Đối với HMM, tính công thức (2) không phải là dễ dàng vì hàm Z không cố định, thay vào đó chúng ta sử dụng thuật toán lấy mẫu Gibbs, lấy dãy tuần tự mẫu sau: y 1 , y 2 ,…, y n0 ,…,y n với phân phối bất biến p(y|x). Sau đó tính trung bình, p(ys|x) được tính bằng - 52 - 0 () 0 1 1 n j s jn y nn =+ − ∑ 4. Thực nghiệm Xây dựng hai hình Baseline và HMM để kiểm thử khả năng nhận dạng màu da thì thấy, khả năng nhận dạng của HMM tốt hơn Baseline. 5. Định hướng phát triển HMM có khả năng nhận dạng tốt hơn Baseline, tuy nhiên do phải lấy mẫu, tốc độ phụ thuộc vào kích thước ảnh, cỡ mẫu nên tốc độ chậm hơn nhiều so với Baseline. Nhiệm vụ sắp tới:  Cải thiện tốc độ tính toán bằng cách giảm kích cỡ ảnh mà không ảnh hưởng tới nhận dạng hoặc có thể giảm số chiều của không gian màu RGB.  Cải thiện khả năng nhận dạng; ở đây, chúng ta chỉ mới áp đặt ràng buộc cho khả năng xuất hiện màu da của hai điểm lân cận, thực tế vùng da còn xuất hiện theo từng nhóm màu…  Áp dụng vào nhận dạng ảnh khiêu dâm. - 53 - . dựng hai mô hình nhận dạng màu da ảnh màu với ràng buộc lấy từ tập cơ sở dữ liệu Compaq. Mỗi mô hình sử dụng entropy cực đại, mô hình đầu tiên là mô hình Baseline,. cho một ảnh màu x tìm ảnh y nhị phân, với màu trắng là da, màu đen không phải là da. 3.5. Nhận dạng màu da Với một ảnh đầu vào, nhận dạng màu da yêu cầu

Ngày đăng: 06/10/2013, 19:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan