Tiểu luận môn ẩn thông tin trên dữ liệu số nghiên cứu một số kỹ thuật steganalysis trên ảnh

11 976 0
Tiểu luận môn ẩn thông tin trên dữ liệu số nghiên cứu một số kỹ thuật steganalysis trên ảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Page |1 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN LỚP CAO HỌC KHÓA 10 ĐỢT THU HOẠCH MÔN ẨN THÔNG TIN TRÊN DỮ LIỆU SỐ ĐỀ TÀI Nghiên cứu số kỹ thuật steganalysis ảnh Huỳnh Ngô Văn1 NỘI DUNG Tóm tắt Steganography kỹ thuật ẩn thông tin nhằm mục đích trao đổi thông tin mật đến đối tượng không muốn đối tượng thứ ba (không mong muốn) phát hay nghi ngờ Steganalysis kỹ thuật đối lập với steganography nhằm phát đối tượng có ẩn thông tin hay không Bài báo giới thiệu tổng quan steganalysis số kỹ thuật nghiên cứu Đối tượng nghiên cứu ảnh có định dạng sau: JPG, GIF, PNG, TIF, BMP Từ Khóa: Steganography, steganalysis Steganography, steganalsis nghiên cứu liên qua 1.1 Steganography 1.1.1.Khái niệm Ẩn thông tin kỹ thuật liên lạc mật dựa hình thức ẩn thông tin quan trọng vào đối tượng khác Ẩn thông tin có tác dụng: bảo vệ quyền số, hay đối tượng liên lạc mật với kênh thông tin công cộng mà bị nghi ngờ Lý quyền số mã hóa sau giải mã khó giữ quyền, hay thông tin mật cần trao đổi bên, sau mã hóa làm cho người khác biết rõ bên có trao đổi thông tin mật với 1.1.2.Kỹ thuật Học viên cao học khóa 10 đợt - 2015, trường UIT, mã học viên: CH1502043 1|Page 2|Page Kỹ thuật ẩn thông tin bit có trọng số thấp LSB kỹ thuật thay bit thông tin vào bit có trọng số thấp điểm ảnhdụ điểm ảnh ản 8bit màu bit cuối (bit thứ 8) gọi bit LSB Do thay đổi giá trị bit không làm ảnh hưởng nhiều đến chất lượng trực quan ảnh Ngoài kỹ thuậtsố kỹ thuật ẩn thông tin khác kỹ thuật chèn nhiễu SS, kỹ thuật điều chỉnh hệ số lượng tử hóa QIM, kỹ thuật ẩn thuận nghịch… 1.1.3.Phương pháp đánh giá độ an toàn lược đồ ẩn thông tin: hiệu: C tập tất ảnh gốc M tập thông tin mật K tập khóa S tập ảnh steganography Một lược đồ ảnh thông tin cặp với hàm nhúng thông tin, hàm tách thông tin Hàm nhúng tạo đối tượng S từ C, M, K, hàm tách tách tin M từ S khóa K Giả sử hàm phân bố xác suất C Nếu khóa K M chọn ngẫu nhiên lược đồ ẩn thông tin ( với hàm phân số xác suất đuoợc hàm phân bố xác suất tương ứng với S Khi theo khái niệm ẩn thông tin an toàn Cachin [1] ta có định nghĩa sau: Định nghĩa: lược đồ ẩn thông tin gọi an toàn sai phân Kullback – Leibler hàm mật độ xác suất 0: Khi lược đồ ẩn thông tin có độ an toàn , số thực dương đủ nhỏ tùy ý cho trước 1.2 Steganalysis 1.2.1.Khái niệm 2|Page Page |3 Steganalysis kỹ thuật phát tồn thông tin nhúng đối tượng 1.2.2.Kỹ thuật Steganalysis định nghĩa toán phân loại dựa kiểm định giả thuyết thống kê Do steganalysis phát biểu: toán kiểm định giả thuyết đơn (simple hyphthesis), toán kiểm định giả thuyết phức hợp (composite hypothesis) Nếu thông tin lược đồ ẩn thông tin kỹ thuật phát gọi phát mù (blind steganalysis) Trong trường hợp biết trước thông tin lược đồ ẩn thông tin gọi phát có ràng buộc (constraint steganalysis) 1.2.3.Tập liệu ảnh thử nghiệm Tập ảnh gốc sử dụng cho thuật toán ẩn phát gồm 2088 ảnh xám với kích thước khác Kỹ thuật Blind Steganalysis cho ảnh nhúng LSB 2.1 Trên miền không gian 2.1.1.Phát phân tích “độ lệch chuẩn” Để phân loại ảnh nhúng ảnh gốc LSB trường hợp ta sử dụng định lý sau: Định lý 1:Cho X đại lượng ngẫu nhiên có phân bố chuẩn N( Khi đại lượng ngẫu nhiên Y=(X-)/ có phân bố chuẩn Nn(0,1) Định lý 2: Cho đại lượng ngẫu nhiên, độc lập phân bố chuẩn N( Khi đại lượng ngẫu nhiên có phân bố chuẩn N( Trong thực tế chưa biết nên ta phải ước lượng Có nhiều phương pháp để ước lượng đại lượng phuong pháp thông dụng đơn giản phương pháp hợp lý cực đại Bằng phương pháp ta thay ước lượng ước lượng hiệu: Khi đại lượng ngẫu nhiên: , , phân bố chuẩn Nn(0,1) không phục thuộc mà phụ thuộc vào n 3|Page 4|Page Đặt V= , đại lượng ngẫu nhiên có phân bố chuẩn N n(0,1) nên V có phân bố chuẩn Nn(0,2) Áp dụng định lý giới hạn trung tâm[2], ta có (1) có phân bố chuẩn Nn(0,1) lập thành bảng XII [2] với n=1,2,3… mức ý nghĩa =0,1;0,05… Đại lượng ngẫu nhiên T từ (1) có phân bố chuẩn N n(0,1) tức ta có xác suất P{T hàm mật độ xác suất chuẩn N n(0,1) cho trước n giá trị xác suất sai số loại I với , ta tìm giá trị ngưỡng phương trình sau đây: Sau tìm ngưỡng toán ta áp dụng để phân loại ảnh sau: kiểm tra - Nếu V , kết luận ảnh không nhúng thông tin - Nếu V , kết luận ảnh có nhúng thông tin 2.1.2.Phát thống kê bậc tư Định lý 3: Gọi m số lần xuất biến A dãy n phép thử Becouli với xác suất xuất biến A P(A) = p>0 Khi đó, đại lượng ngẫu nhiên có xấp xỉ phân bố chuẩn N(0,1), với q = 1-p Bổ đề 1: Giả sử cho trước dãy nhị phân lấy từ nguồn ngẫu nhiên, độc lập s=,…, hiệu tần suất số “0” “1” xuất dãy (tức Đặt Khi đó, s ngẫu nhiên, độc lập z có phân bố “” bậc tự (với n>=10) Áp dụng bổ đề vào việc phân loại ảnh có nhúng thông tin LSB cách tính tần suất điểm ảnh ảnh cần kiểm tra vevtor C 25x10 Thực tiếp số bước: i Tìm giá trị lớn C 25x10 hiệu (() có giá trị lớn hàng C25x10) ii Tính ,, Áp dụng bổ đề 1, ta có có phân bố bậc tự 4|Page Page |5 iii Kết luận, ảnh kiểm tra ảnh không nhúng, ngược lại ảnh kiểm tra ảnh nhúng với xác suất sai số 2.2 Trên miền tần số 2.2.1.Phân tích Ẩn thông tin miền tần số cosin hay wavelet hình thức ẩn thông tin LSB hệ số cosin miền tần số hay băng tần cao Theo Provos, kỹ thuật ẩn thông tin LSB hệ số cosin gây cân cặp PoV hệ số cosin[2] Do Provos áp dụng phương pháp thống kê với n bậc tự cho cặp PoV hệ số cosin …, (-8,-7),(-6,-5),(-4,-3),(-2,-1),(2,3),(4,5),(6,7)… 2.2.2.Kỹ thuật steganalysis Thuật toán áp dụng cho ảnh nhúng LSB miền tần số DCT Đầu vào: Cho tập ảnh JPEG (gồm có ảnh nhúng hệ số cosin ảnh gốc) Đầu ra: Phân loại tập ảnh thành hai tập: ảnh nhúng ảnh không nhúng LSB hệ số cosin Các bước thực hiện: Bước 1: Chọn ảnh I tập ảnh đầu vào, thực bước bước sau quay lại chọn ảnh khác Bước 2: Thống kê tần số hệ số DCT ảnh I vào ma trận (giá trị n xác định từ số hệ số có tần số lớn 0) với tần số hệ số cosin có giá trị i Thực tính với Ta có: T = Bước 3: Chọn =500 (theo tập mẫu thử nghiệm 1200 ảnh Nếu T>thì I lưu vào tập ảnh gốc, ngược lại I lưu vào tập ảnh có nhúng LSB hệ số cosin 5|Page 6|Page Một số kỹ thuật steganalysis có ràng buộc 3.1 Kỹ thuật HKC 3.1.1.Giới thiệu Kỹ thuật HKC J.H.Hwang đề xuất năm 2006[3], dựa phương pháp dịch chuyển biểu đồ tần suất sau: chọn điểm Peak điểm có cột tần suất lớn biểu đồ tần suất, sau chọn hai điểm Zero1 Zero2 (các điểm có cột tần suất có giá trị 0) bên trái bên phải điểm Peak Sau thực làm rỗng cột tần suất vị trí Peak+1 Peak-1 Thực nhúng thông tin vào ảnh theo nguyên tắc: giả sử cần nhúng bit b, quét ảnh theo thứ tự raster điểm ảnh có giá trị Peak-2 Peak+2, kiểm bit b cần nhúng: thông tin “1” điểm ảnh có giá trị Peak -2 tăng lên 1, nêu điểm ảnh có giá trị Peak+2 giảm “1”, bit thông tin “0” trì cũ 3.1.2.Kỹ thuật HKC ước lượng thông tin nhúng ảnh 3.1.2 Kỹ thuật Kuo Lin Năm 2008, W.C.Kuo Y.H.Lin đề xuất kỹ thuật steganalysis ảnh có nhúng sử dụng kỹ thuật HKC[4] Họ quan sát biểu đồ tần số dựa đỉnh Peak trước sau nhúng thấy giá trị lân cận bên đỉnh peak bị tụt xuống nhúng tin  Điểm Peak: (a) chưa nhúng, (b) nhúng, (c) nhúng không đầy dủ họ đưa định lý để xây dựng kỹ thuật steganalysis đây: Định lý 4: Có năm cặp giá trị liên tiếp , với cặp giá trị điểm Peak Tỉ lệ thay đổi điểm liên tục mối quan hệ láng giềng định nghĩa biểu thức sau: giá trị ngưỡng 6|Page Page |7 Áp dụng định lý này, Kuo Lin đưa thuật toán phát ảnh nhúng sử dụng kỹ thuật HKC theo bước sau: i Tìm cặp giá trị điểm peak ( ii Tính tỉ lệ thay đổi mối quan hệ láng giềng sử dụng định lý iii Nếu năm cặp giá trị liên tiếp lân cận thỏa mãn (4.1) (4.2), kết luận ảnh có nhúng, ngược lại ảnh không nhúng 3.1.2 Thử nghiệm kỹ thuật HKC ước lượng thông tin Mặt khác thấy đưa biểu thức đơn giản sử dụng kỹ thuật HKC Dựa vào phân tích ví dụ: ảnh gốc ban đầu có biểu đồ tần số hình 3.1: (a)tổng cột giá trị lân cân bên trái cột giá trị lân cận bên phải điểm Peak lớn Peak, với biểu đồ tần số ảnh có nhúng (c) ngược lại Cũng dựa vào mối quan hệ bị thay đổi vùng lân cận mà ước lượng số bit thông tin nhung ảnh dựa vào Ban đầu để nhúng tin phải dịch chuyển sang , sang , nghĩa làm cho , Sau nhúng bit “1” chuỗi thông tin làm dịch chuyển phần , sang (theo thuật toán HKC) bit “0” ngầm định nhúng vào điểm ảnh Peak-2 Peak+2 Gọi , số bit “0” bit “1” chuỗi thông tin M cần nhúng đó: =, , chuỗi thông tin M đại lượng ngẫu nhiên có phân bố nên xác suất bit “0” xác suất bit “1” xấp xỉ 0.5 (P(0) Vậy độ dài bit thông tin M nhúng ảnh sử dụng HKC tính theo biểu thức sau: L=2=2 3.2 Kỹ thuật DIH 3.2.1 Giới thiệu Kỹ thuật DIH nhóm tác giả Lee cộng đề xuất năm 2004[5] Ban đầu nhóm tác giả tính giá trị sai phân điểm ảnh theo công thức d(i,j)=I(i+1,j) - I(I,j) tính biểu đồ tần số cho giá trị sai phân Họ thấy giá trị tần số tập trung phần lớn vào hệ số sai phân có giá trị -2, -1, 0, 1, 2, nhúng thông tin dựa vào giá trị Để sau nhúng 7|Page 8|Page khôi phục ảnh gốc, họ phải dịch chuyển cột tần số có giá trị sai phân lớn nhỏ -1 để làm rỗng cột tần số có giá trị -2 Sau chuỗi bit thông tin nhúng vào điểm ảnh mà giá trị sai phân có giá trị -1, bit thông tin nhúng hệ số sai phân chuyển thành 2, 01 chuyển thành -2, ngược lại giữ nguyên 3.2.2.Thử nghiệm kỹ thuật DIH Bằng phương pháp phân tích biểu đồ tần số sai phân ảnh trước sau nhúng phát ước lượng xấp xỉ ảnh có nhúng sử dụng kỹ thuật DIH sau: nhúng thông tin giống vào tập ảnh gốc sử dụng kỹ thuật DIH nhận tập ảnh stego (ảnh nhúng) Thực tính toán lại biểu đồ tần số sai phân cặp ảnh (gốc, nhúng) dễ dàng nhận thấy DIH thay đổi tính chất tự nhiên giá trị sai phân Sự thay đổi DIH tạo ra, thay đổi tần số ảnh để nhúng thông tin Đây vấn đề mấu chốt để phát ảnh nhúng, với biểu thức sau: S(O) Với T ngưỡng để phân loại 3.3 Kỹ thuật IWH 3.3.1.Giới thiệu Xuan cộng đề xuất kỹ thuật IWH (Integer Waveket Histogram) vào năm 2006[6] Kỹ thuật có ý tưởng gần giống kỹ thuật DIH, nhiên khác chỗ thay dịch chuyển cột tần số giá trị sai phân họ sử dụng phương pháp dịch chuyển tần số hệ số biến đổi wavelet nguyên Họ thực phép biến đổi wavelet cho miền liệu ảnh theo chuẩn biến đổi kỹ thuật nén JPEG2000 để bốn tần (LL,LH,LH,HH) Sau họ nhúng thông tin vào băng tần cao LH,HL,HH nơi cho ảnh hưởng đến ảnh gốc Tính tần số hệ số IWT, cột tần số có giá trị lớn ơn Z (Z số nguyên chọn tùy ý) bị dịch chuyển sang phải, mục đích làm rỗng cột tần số có giá trị Z, thông tin nhúng vào hệ số có giá trị Z-1 Z Nếu trường hợp số bit cần nhúng lớn số hệ số wavelet có giá trị Z-1, thực tiếp nhúng thông tin sang hệ số có giá trị (Z+1) giá trị đối xứng qua hệ số 0, việc thực nhúng tương tự, ban đầu phải làm rỗng cột tần số -Z, sau nhúng thông tin vào hệ số có giá trị -(Z-1) –Z Nếu bit thông tin tiếp tục nhúng vào hệ số Z-2, nhúng 8|Page Page |9 xong thông tin Giả sử việc nhúng dừng lại hệ số có giá trị S hệ số bắt đầu nhúng tin T 3.3.2.Kỹ thuật IWH Để công ước lượng nhúng sử dụng kỹ thuật IWH, tác giả đưa số phân tích trình nhúng dựa thử nghiệm: Trong thử nghiệm thứ 1, sử dụng ảnh Lena (kích thước 512 x 512 pixel) thông tin nhúng ảnh nhị phân (128x56 pixel) Tính tần số giá trị wavelet miền băng tần cao (LH,HL,HH) Nhúng thông tin phương pháp IWH với Peak chọn khởi điểm T=2, nhận điểm dừng S=-2 Thử nghiệm thứ 2, đầu vào trên, nhúng thông tin chọn T=4, nhận điểm dừng S=3 Thử nghiệm thứ 3, đầu vào tương tự, chọn T=6, nhận S=-5 So sánh khác biệt biểu đồ tần số hệ số wavelet ảnh gốc ảnh nhúng, thấy ảnh điển hình với hệ số IW có giá trị i Trong ảnh nhúng thí nghiệm ta thấy , thí nghiệm thứ có , thí nghiệm thứ Từ tổng quát ước lượng độ dài thông tin sau: i Khởi tạo độ dài thông tin L=0, quét toàn tần số với giá trị I (i>=0, i[...]... e | 11 IWH, RVH và thử nghiệm trên những kỹ thuật đó để ước lượng xấp xỉ thông tin đã nhúng trong ảnh 5 Tài liệu tham khảo [1] C Cachin(1998), An information – theoretic model for steganography, In D.Aucsmith, editor, Information hiding, 2nd International Worksohp, volume 1525 of LNCS, Springer – Verlag, NewYork, pp.306-318 [2] N Provos and Peter Honeyman (2001), Detecting Steganographic Content on... H Hwang, J W Kim, and J U Choi(2006), A reversible Watermarking Based on Histogram Shifting, IWDW 2006, pp 384-361 [4] Wen-Chung Kuo, Yan-Hung Lin(2008), On the Security of Reversible Data Hiding Based-on Histogram Shift, ICICIC 2008, pp 174-177 [5] K Sullivan, U Madhow, B S Manjunath and S Chandrasekaran (2005), Steganalysis for Markov Cover Data with Applications to Images, Submitted to IEEE Transactions... with Applications to Images, Submitted to IEEE Transactions on Information Forensics and Security [6] G Xuan, Q Yao, C Yang, J Gao, P Chai, Y Q Shi, Z Ni (2006), Lossless Data Hiding Using Histogram Shifting Method Based on Integer Wavelets, Proc 5th Digital watermarking workshop, IWDW 2006, Korea, vol 4283, pp 323-332 [7] P M Kumar, K L Sunmuganathan (2010), A reversible high embedding capacity data ... không làm ảnh hưởng nhiều đến chất lượng trực quan ảnh Ngoài kỹ thuật có số kỹ thuật ẩn thông tin khác kỹ thuật chèn nhiễu SS, kỹ thuật điều chỉnh hệ số lượng tử hóa QIM, kỹ thuật ẩn thuận nghịch…... toàn lược đồ ẩn thông tin: Ký hiệu: C tập tất ảnh gốc M tập thông tin mật K tập khóa S tập ảnh steganography Một lược đồ ảnh thông tin cặp với hàm nhúng thông tin, hàm tách thông tin Hàm nhúng... Kết luận, ảnh kiểm tra ảnh không nhúng, ngược lại ảnh kiểm tra ảnh nhúng với xác suất sai số 2.2 Trên miền tần số 2.2.1.Phân tích Ẩn thông tin miền tần số cosin hay wavelet hình thức ẩn thông tin

Ngày đăng: 17/12/2016, 09:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan