Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền

32 347 0
Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ THÔNG TIN Họ tên tác giả VŨ VĂN HUY Họ tên tác giả VŨ VĂN HUY Tên đề tài Tên đề tài THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG GIẢI THUẬT DI TRUYỀN THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG GIẢI THUẬT DI TRUYỀN Chuyên ngành: Khoa học máy tính Mã số: 604801 LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS BÙI THẾ HỒNG Thái Nguyên - 2009 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Thái Nguyên - 2009 http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Ngun http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN LỜI NĨI ĐẦU Tơi xin cam đoan luận văn “Thủy vân sở liệu quan hệ dựa kỹ thuật tối ƣu hoá áp dụng giải thuật di truyền” cơng trình nghiên cứu riêng Các số liệu sử dụng luận văn trung thực Các kết nghiên cứu trình bày luận văn chưa cơng bố cơng trình khác Vũ Văn Huy Để hồn thành luận văn này, trước tiên tơi xin chân thành cảm ơn bảo tận tình TS Bùi Thế Hồng, người nhiệt tình bảo góp ý giúp tơi hồn thành luận văn Tôi xin chân thành cảm ơn Khoa Công nghệ thông tin – Đại học Thái Nguyên, Viện Công nghệ thông tin tạo điều kiện giúp tơi hồn thành luận văn Tôi xin chân thành cảm ơn bạn Võ Phúc Nguyên – Gv Khoa Điện Tử - ĐH Kỹ thuật công nghiệp Thái Nguyên trợ giúp nhiều q trình hồn thành luận văn Lời sau xin chân thành cảm ơn người thân gia đình bạn đồng nghiệp động viên tơi hồn thành luận văn Vũ Văn Huy -1- -22.2.2 Theo kiểu biến dạng (Distortion) 23 2.2.3 Theo độ nhạy (Sensitivity) 24 MỤC LỤC MỤC LỤC DANH MỤC CÁC THUẬT NGỮ DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG BIỂU MỞ ĐẦU Lý lựa chọn đề tài Mục tiêu nghiên cứu Phạm vi nghiên cứu Phƣơng pháp nghiên cứu Ý nghĩa khoa học ý nghĩa thực tiễn đề tài Cấu trúc luận văn CHƢƠNG – TỔNG QUAN VỀ THUỶ VÂN VÀ GIẢI THUẬT DI TRUYỀN 1.1 Cơ kỹ thuật giấu tin 10 1.1.1 Khái niệm giấu tin 10 1.1.2 Phân loại kỹ thuật giấu tin 10 1.1.3 Mục đích giấu tin 12 1.1.4 Môi trƣờng giấu tin 12 1.2 Cơ thuỷ vân 14 1.2.1 Khái niệm thuỷ vân 14 2.2.4 Theo thông tin thuỷ vân (watermark information) 25 2.2.5 Tính kiểm tra đƣợc 26 2.2.6 Theo cấu trúc liệu (Data structure) 27 CHƢƠNG – NỘI DUNG VÀ CÁC KẾT QUẢ NGHIÊN CỨU 29 3.1 Phân hoạch liệu 29 3.2 Nhúng thuỷ vân 33 3.2.1 Mã hoá bit đơn 34 3.2.2 Áp dụng giải thuật di truyền giải toán tối ƣu 38 3.2.3 Thuật toán nhúng thuỷ vân 41 3.2.4 Đánh giá ngƣỡng giải mã 42 3.3 Giải mã thuỷ vân 46 3.4 Kết thực nghiệm 48 KẾT LUẬN VÀ KIẾN NGHỊ 52 PHỤ LỤC 54 TÀI LIỆU THAM KHẢO 57 1.2.2 Một số vấn đề có liên quan đến thuỷ vân 16 1.2.3 Khái niệm thuỷ vân sở liệu 17 1.3 Một số ứng dụng thuỷ vân 18 1.3.1 Bảo vệ quyền tác giả (copyright protection) 18 1.3.2 Phát xuyên tạc thông tin (authentication and tamper detection) 18 1.3.3 Lấy dấu vân tay hay dán nhãn (fingerprinting and labeling) 19 1.3.4 Điều khiển thiết bị (Device control) 19 1.3.5 Theo dõi trình sử dụng (Tracking) 19 1.3.6 Theo dõi truyền thông (Broadcast Monitoring) 19 1.3.7 Truyền tin bí mật (Concealed Communication) 20 1.4 Giải thuật di truyền 20 CHƢƠNG – THỰC TRẠNG NGHIÊN CỨU THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ 22 2.1 Tình hình nghiên cứu nƣớc 22 2.2 Tình hình nghiên cứu giới 22 2.2.1 Theo kiểu liệu (Data type) 23 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn -3- -4- DANH MỤC CÁC THUẬT NGỮ MSB (Most significant bit): Bit ý nghĩa DANH MỤC CÁC HÌNH VẼ Hình 1.1 Một cách phân loại kỹ thuật giấu tin 11 LSB (Least significant bit): Bit ý nghĩa Hình Cách phân hoạch liệu 32 MAC (Message Authentication Code) : Mã xác thực thơng điệp Hình Thống kê phân bố tập Xmax, Xmin cách lấy ngưỡng T* 45 GA (Genetic Algorithms): Giải thuật di truyền Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn -5- -6- DANH MỤC CÁC BẢNG BIỂU MỞ ĐẦU Lý lựa chọn đề tài Bảng Danh mục ký hiệu 30 Mục tiêu nghiên cứu Bảng Thống kê công với số lần công 20 51 Phạm vi nghiên cứu Phƣơng pháp nghiên cứu Ý nghĩa khoa học ý nghĩa thực tiễn Cấu trúc luận văn Lý lựa chọn đề tài Ngày nay, ứng dụng sản phẩm số bao gồm sở liệu quan hệ phát triển phân phối rộng khắp mơi trường Internet, việc chứng minh quyền sở hữu sản phẩm sau chuyển giao vấn đề cần thiết Việc thực thi quyền sở hữu liệu yêu cầu quan trọng đòi hỏi giải pháp đồng bộ, bao gồm khía cạnh kỹ thuật, tổ chức, luật pháp Mặc dù chưa có giải pháp toàn diện năm gần đây, kỹ thuật thuỷ vân đóng vai trò định nhằm giải vấn đề quyền sở hữu Hiện nay, có vài cách tiếp cận toán thuỷ vân liệu quan hệ đề xuất Tuy nhiên, kỹ thuật không bền vững trước cơng thơng thường cơng gây hại, cần có kỹ thuật thủy vân sở liệu quan hệ có độ bền vững cao cơng xố, sửa, chèn ghi Luận văn “thủy vân sở liệu quan hệ dựa kỹ thuật tối ưu hố áp dụng giải thuật di truyền” trình bày kỹ thuật thuỷ vân sở liệu Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn -7- -8- dựa vào kỹ thuật tối ưu hoá Kỹ thuật phải đảm bảo bền vững trước công thêm, bớt thay đổi giá trị quan hệ Ý nghĩa khoa học ý nghĩa thực tiễn đề tài Đưa sở khoa học việc áp dụng kỹ thuật tối ưu hoá để mã hoá giải mã thuỷ vân sử dụng giải thuật di truyền để giải Mục tiêu nghiên cứu Mục tiêu luận văn sâu nghiên cứu kỹ thuật tối ưu hoá để toán tối ưu hố mã hố giải mã thuỷ vân Trong tập trung nghiên cứu kỹ thuật phân Kết nghiên cứu đề tài có ý nghĩa việc chứng minh hoạch liệu không phụ thuộc vào đánh dấu để định vị phân quyền sở hữu sản phẩm số hoá, đặc biệt sở liệu hoạch; nghiên cứu cách giải toán tối ưu giải thuật di truyền với quan hệ sau phân phối chuyển giao Đồng thời việc chứng minh ràng buộc thuộc tính chọn để tiến hành thủy vân, nghiên cứu kỹ quyền sở hữu vấn đề quan trọng môi trường ứng thuật phát thủy vân dựa vào ngưỡng tối ưu dụng dựa Internet nhằm phát tán truyền tải thông tin Phạm vi nghiên cứu Cấu trúc luận văn Phạm vi nghiên cứu đề tài sâu nghiên cứu mặt lý thuyết Ngoài phần mở đầu phần kết luận, luận văn trình bày thành ba chương sau: thuỷ vân áp dụng cho sở liệu quan hệ Nghiên cứu chế mã hoá giải mã thuỷ vân sở liệu quan hệ dựa kỹ thuật tối ưu hoá áp dụng thuật toán di truyền - Chƣơng Tổng quan thuỷ vân giải thuật di truyền Chương chủ yếu trình bày thông tin kỹ thuật giấu tin, khái niệm thuỷ vân ứng dụng thực tiễn Phƣơng pháp nghiên cứu thuỷ vân, sơ lược giải thuật di truyền Luận văn luận văn thuộc ngành kỹ thuật chuyên ngành khoa học máy tính nên phương pháp nghiên cứu chủ yếu phương pháp tiếp cận lý thuyết, sau áp dụng lý thuyết vào ngơn ngữ lập trình cụ thể để kiểm chứng Dựa kết kiểm chứng để đưa kết luận đề xuất nhằm hoàn thành mục tiêu nghiên cứu luận văn Cụ thể luận văn này, tác giả lấy thông tin tiêu thụ điện làm sở - Chƣơng Thực trạng nghiên cứu thuỷ vân sở liệu quan hệ Chương chủ yếu trình bày thực trạng nghiên cứu thuỷ vân sở liệu quan hệ nước giới - Chƣơng Nội dung kết nghiên cứu liệu phục vụ cho nghiên cứu; nghiên cứu lý thuyết thuỷ vân; nghiên cứu Chương sâu mô tả chi tiết lý thuyết bước tiến hành thí cách giải toán tối ưu hoá giải thuật di truyền; sử dụng phần mềm nghiệm áp dụng kỹ thuật tối ưu hoá cho mã hoá giải mã thuỷ vân số Matlab để lập trình kiểm chứng lý thuyết Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn -9- - 10 - CHƢƠNG – TỔNG QUAN VỀ THUỶ VÂN VÀ GIẢI THUẬT DI TRUYỀN Nhiều phương pháp giấu thông tin khác đề xuất, phương pháp có ưu điểm, nhược điểm riêng thích hợp cho nhóm ứng dụng Cơ giấu tin Cơ thuỷ vân Một số ứng dụng thuỷ vân Giải thuật di truyền 1.1 Cơ kỹ thuật giấu tin 1.1.1 Khái niệm giấu tin Giấu thông tin (Datahiding) kỹ thuật nhúng (embedding) lƣợng thơng tin số vào đối tƣợng liệu số khác Một yêu cầu giấu tin đảm bảo tính chất ẩn thơng tin giấu Thông tin kỹ thuật số đem lại thay đổi sâu sắc xã hội đồng thời không làm ảnh hưởng đến chất lượng liệu gốc Đây sống ngày Những thuận lợi mà thông tin kỹ phương pháp nhiều nước giới nghiên cứu ứng thuật số mang lại sinh thách thức hội cho xã hội dụng mạnh mẽ đại Mạng Internet toàn cầu biến thành xã hội ảo nơi diễn q trình Sự khác biệt chủ yếu mã hố thơng tin giấu thơng tin mã hố trao đổi thông tin lĩnh vực đời sống Và mơi trường làm cho thơng tin rõ có mã hố hay khơng, với giấu mở tiện nghi xuất vấn nạn, tiêu cực cần đến thơng tin người ta khó biết có thơng tin giấu bên giải pháp hữu hiệu cho vấn đề an tồn thơng tin nạn ăn cắp quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép, chép bất 1.1.2 Phân loại kỹ thuật giấu tin Do kỹ thuật giấu thơng tin số hình thành thời gian gần hợp pháp sản phẩm trí tuệ số v.v Giải pháp cho vấn đề biết đến áp dụng giải nên xu hướng phát triển chưa ổn định Nhiều phương pháp mới, theo pháp giấu tin (DataHiding), nghiên cứu phát triển khoảng nhiều khía cạnh khác đề xuất, tồn nhiều cách chục năm gần Trong thuỷ vân (watermark) thành phần phân loại khác Dựa việc thống kê cơng trình cơng bố tạp chí, phương pháp giấu tin Giấu thơng tin bao gồm hai kỹ thuật thuỷ ấn (watermarking) với thơng tin tên tóm tắt nội dung cơng trình cơng bố giấu tin bí mật (steganograph) quan tâm nghiên cứu phát Internet, người ta chia lĩnh vực giấu tin làm hai hướng lớn, triển Các thành tựu đạt lĩnh vực nghiên cứu bắt đầu watermarking steganography áp dụng hiệu cho mục đích bảo vệ quyền, chống chép, phân tán Steganography quan tâm tới ứng dụng che giấu tin đòi hỏi độ trái phép sản phẩm mơi trường số hố nhiều mục đích khác bí mật cao dung lượng lớn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn http://www.lrc-tnu.edu.vn - 11 - - 12 - Watermark (thủy vân) quan tâm nhiều đến ứng dụng giấu mẩu tin ngắn đòi hỏi độ bền vững lớn thông tin cần giấu (trước biến đổi thông thường tệp liệu môi trường) 1.1.3 Mục đích giấu tin Bảo mật thơng tin giấu tin có hai khía cạnh Một bảo mật cho liệu đem giấu (embedded data), chẳng hạn giấu tin mật: thông tin Information mật giấu kỹ đối tượng khác cho người khác không phát hiding (steganography) Hai bảo mật đối tượng dùng để Giấu thơng tin giấu liệu vào (host data), chẳng hạn ứng dụng bảo vệ quyền, phát xuyên tạc thông tin (watermarking) Steganograp hy Giấu tin mật Watermarkin g Thuỷ vân số 1.1.4 Môi trƣờng giấu tin Kỹ thuật giấu tin nghiên cứu áp dụng nhiều môi Robust Copyright marking Thuỷ vân bền vừng Fragile marking Thuỷ vân “dễ vỡ” trường liệu khác liệu đa phương tiện (text, image, audio, video), sản phẩm phần mềm gần nghiên cứu môi trường sở liệu quan hệ Trong mơi trường liệu liệu Imperceptible Watermarking Thuỷ vân ẩn Visible Watermarking Thuỷ vân hiển thị Hình 1.1 Một cách phân loại kỹ thuật giấu tin đa phương tiện môi trường chiếm tỉ lệ chủ yếu kỹ thuật giấu tin a Giấu tin ảnh Giấu thông tin ảnh, nay, phận chiếm tỉ lệ lớn chương trình ứng dụng, phần mềm, hệ thống giấu tin đa Đối với hướng lớn trên, q trình phân loại theo tiêu chí khác phương tiện lượng thông tin trao đổi ảnh lớn dựa theo ảnh hưởng tác động từ bên ngoài, người ta chia giấu thơng tin ảnh đóng vai trị quan trọng hầu watermark thành hai loại, loại bền vững với tác động chép trái hết ứng dụng bảo vệ an tồn thơng tin như: nhận thực thơng tin, xác định phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ bị phá huỷ trước xuyên tạc thông tin, bảo vệ quyền tác giả, điều khiển truy cập, giấu thơng tác động nói Cũng chia watermark theo đặc tính, loại cần tin mật Vì vấn đề giấu tin ảnh quan tâm lớn che giấu để có số người tiếp xúc với thấy thơng nhà nghiên cứu Thông tin giấu với liệu ảnh chất lượng ảnh bị tin, loại thứ hai đối lập, cần người nhìn thấy thay đổi nhận biết thị giác người, bị phát “thị giác máy” Ngày nay, ảnh số sử dụng phổ biến, giấu thơng tin ảnh đem lại nhiều ứng dụng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 13 - - 14 - quan trọng nhiều lĩnh vực đời sống xã hội việc nhận thực chữ kí tính đồng tính an tồn thơng tin Các phương pháp giấu thông tin số, xác thực thông tin trở thành vấn đề quan trọng mà việc audio lợi dụng điểm yếu hệ thống thính giác người ăn cắp thông tin hay xuyên tạc thông tin tin tặc trở thành c Giấu thông tin video vấn nạn quốc gia nào, tổ chức Một đặc điểm giấu Cũng giống giấu thông tin ảnh hay audio, giấu tin thơng tin ảnh thơng tin giấu ảnh cách vơ hình, video quan tâm phát triển mạnh mẽ cho nhiều ứng dụng cách mà truyền thông tin mật cho mà người khác điều khiển truy cập thông tin, nhận thực thông tin bảo vệ quyền biết sau giấu thơng tin chất lượng ảnh gần không thay tác giả Các kỹ thuật giấu tin video phát triển mạnh mẽ đổi đặc biệt ảnh mầu hay ảnh xám theo hai khuynh hướng thuỷ vân số datahiding Một phương pháp b Giấu tin audio giấu tin video đưa Cox phương pháp phân bố Ý Giấu thông tin audio mang đặc điểm riêng khác với giấu tưởng phương pháp phân phối thông tin giấu dàn trải theo tần số thông tin đối tượng đa phương tiện khác Một yêu cầu liệu chứa gốc Một số nhà nghiên cứu khác dùng hàm Cosin giấu tin đảm bảo tính chất ẩn thơng tin giấu đồng thời riêng hệ số truyền sóng riêng để giấu tin Trong thuật tốn khởi khơng làm ảnh hưởng đến chất lượng liệu gốc Để đảm bảo yêu cầu nguồn thường kỹ thuật cho phép giấu ảnh vào video này, kỹ thuật giấu thông tin ảnh phụ thuộc vào hệ thống thị giác thời gian gần kỹ thuật cho phép giấu âm hình ảnh vào người - HVS (Human Vision System) cịn kỹ thuật giấu thông tin audio video lại phụ thuộc vào hệ thống thính giác HAS (Human Auditory System) Và Giấu tin công nghệ phức tạp, nhà khoa vấn đề khó khăn hệ thống thính giác người nghe học tập trung nghiên cứu nhiều nước giới Tuy nhiên, kết tín hiệu giải tần rộng cơng suất lớn nên gây khó dễ thực nghiệm cho thấy để thực ứng dụng thực tế lĩnh vực cần phương pháp giấu tin audio Nhưng thật may HAS lại việc phải có thêm thời gian để nghiên cứu thẩm định phát khác biệt dải tần cơng suất điều có nghĩa âm to, cao tần che giấu âm nhỏ thấp cách dễ dàng Các mô hình phân tích tâm lí điểm yếu thơng tin giúp ích cho việc chọn audio thích hợp cho việc giấu tin 1.2 Cơ thuỷ vân 1.2.1 Khái niệm thuỷ vân Thuỷ vân số (digital watermarking) q trình chèn thơng tin vào Vấn đề khó khăn thứ hai giấu thông tin audio kênh liệu số đảm bảo cảm nhận giác quan người truyền tin Kênh truyền hay băng thông chậm ảnh hưởng đến chất lượng lại dễ dàng phát thuật toán máy tính Một dấu thuỷ thơng tin sau giấu Giấu thơng tin audio địi hỏi u cầu cao vân (watermark) mà mẫu thông tin suốt khơng thể nhìn thấy Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 15 - - 16 - giác quan chèn vào vị trí thích hợp liệu số cách sử dụng thuật tốn đặc biệt + Trích watermark hay kiểm chứng: Cho phép kiểm tra tồn watermark liệu nhúng Tuỳ thuộc vào mục đích ứng dụng mà yêu cầu hệ thống watermarking đặt Với hệ thống thực tế, hệ thống thuỷ vân địi hỏi 1.2.2 Một số vấn đề có liên quan đến thuỷ vân Visible watermarks – thủy vân hiện, giống tên gọi, yêu cầu sau: + Tính khơng nhận thấy đƣợc (Imperceptibility): Các điều chỉnh mẫu thông tin, tương tự logo chèn vào ảnh video Kỹ gây nhúng watermark phải thấp ngưỡng cảm thụ người, thuật chủ yếu áp dụng cho ảnh để đánh dấu ảnh sở liệu nghĩa mẫu dùng nhúng watermark phép thay đổi nhỏ ảnh ngăn chặn mua bán web có sử dụng ảnh Kỹ thuật giới hạn cho phép kết hợp thuỷ vân với ảnh gốc dùng cách thay đổi độ sáng ảnh gốc + Tính bền vững (Robustness): Đây yêu cầu nòng cốt cách dùng hàm thuỷ vân với khố bí mật Khố bí mật xác định watermarking Tùy vào loại ứng dụng mà tính bền vững giá trị giả ngẫu nhiên dùng cho việc điều chỉnh độ sáng, mục đích để gây nhìn nhận nhiều quan điểm khác nhau, ứng dụng khó khăn cho cơng xố bỏ dấu dùng để bảo vệ quyền sở hữu watermark cần phải bền vững qua số Watermarking – Thuỷ vân, ngược lại với steganography, có thêm hành động cập nhật nội dung liệu Nếu ứng dụng để chống khái niệm bền vững với công Ngay tồn thông tin làm giả chống lại thay đổi liệu địi hỏi watermark phải huỷ ẩn bị lộ kỹ thuật gây khó khăn cho kẻ cơng bỏ có tác vụ xảy khơng biết khố bí mật Lý bền vững phương thức + Tính khơng chia tách đƣợc (Inseparability): Sau liệu thuỷ vân nhúng nhiều lần thơng tin nhỏ liệu cần bảo vệ nhúng watermark u cầu phải khó khơng thể tách thành phần phương thức steganographic Trên thực tế steganographic riêng biệt lúc đầu watermarking khơng phải hai phương thức có phần bổ sung cho nhiều + Bảo mật (Security): Sau nhúng watermark vào liệu, đối lập yêu cầu cho phép user có quyền chỉnh sửa phát Fingerprinting labeling (lấy dấu vân tay gán nhãn) thuật watermark điều thực nhờ vào key dùng làm khoá giải ngữ biểu thị ứng dụng đặc biệt thuỷ vân, chúng giống thuật nhúng watermark vào liệu giải thuật phát watermark thơng tin tạo hố đặc trưng nhúng vào đối tượng liệu Fingerprinting có nghĩa q trình thuỷ vân với thơng tin nhúng + Tìm lại watermark: Có thể cần không cần đến liệu gốc bên cạnh chuỗi mã có chứa đặc trưng liệu tìm lại thuỷ vân nhúng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên mã xác định tác giả xác định liệu gốc mã http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 31 - - 32 - Bộ liệu D quan hệ sở liệu với lược đồ D(P, A0,…, Av-1) r.P + P thuộc tính khố S1 + A0,…, Av-1 v thuộc tính cho việc thuỷ vân |D| số ghi D Bộ liệu D chia thành m phần không giao (hay không chồng lên nhau) {S0,…., Sm-1}, cho phần Si chứa trung bình | D| m S2 S3 Field1 Field … 10 11 12 13 14 15 ghi từ liệu D Các phần không giao nhau, tức là, với phần Si n-1 n Sj mà i  j Si  S j    Với ghi r  D , thuật toán phân hoạch liệu tính tốn mã xác Hình Cách phân hoạch liệu thực thông tin (MAC) để đảm bảo an tồn q trình phân hoạch mã Sử dụng đặc tính để hàm băm an toàn sinh tin cho hàm băm H(Ks || H(r.P || Ks)) , | D| m + r.P khố ghi r phân phối cách giống nhau, kỹ thuật phân hoạch trung bình chứa + H() hàm băm an toàn ghi phần phân hoạch Hơn nữa, kẻ cơng khơng + || tốn tử nối thể đốn trước ghi chia thành phần mà khơng biết rõ Sử dụng MAC tính toán, ghi chia cho phần Với khố bí mật Ks số phần liệu phân hoạch m giữ bí mật Giữ m bí ghi r , phần chia tính sau: mật khơng phải địi hỏi Tuy nhiên, giữ bí mật để gây khó khăn cho partition(r) = H(Ks || H(r.P || Ks)) mod m kẻ cơng muốn tái sinh phần Thuật tốn phân hoạch liệu mơ tả sau: Algorithm: get_partitions Input: liệu D, khố bí mật Ks, số phần phân hoạch m Output: Các phần liệu S0,…., Sm-1 S0,…., Sm-1  {} for each Tuple r  D partition(r)  H(Ks || H(r.P || Ks)) mod m insert r into Spartition(n) return S0,…., Sm-1 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 33 - - 34 Để đơn giản, ta giả sử ghi phần phân hoạch S i chứa thuộc Mặc dù có mặt khố quan hệ thuỷ vân phổ biến liệu quan hệ, kỹ thuật dễ dàng mở rộng để xử lý trường hợp quan hệ khơng có khố Giả sử quan hệ thuộc tính đơn,  bít ý nghĩa (MSB) liệu dùng để thay cho tính số đơn Trong trường hợp này, phần S i biểu diễn véc tơ liệu số Si  Si , , Sin  n 3.2.1 Mã hoá bit đơn Cho bít thuỷ vân bi, véc tơ liệu số Si  Si , , Sin  n [22] khố Việc sử dụng MSB cho liệu nhúng thuỷ vân thay đổi không giống  bít MSB thay đổi Tuy nhiên, nhiều ghi chia Thuật tốn mã hố bít ánh xạ vectơ liệu S i thành vectơ liệu  bít MSB cho phép kẻ cơng suy luận thông tin  để làm cực tiểu phân phối phần liệu Giải pháp chọn hạn chế ràng buộc Gi  g i1 , , g ip  Việc mã hoá dựa hoá hàm mã hoá tối ưu hàm giấu định nghĩa sau: sẻ *) Các giá trị thực nghiệm luận văn tác giả áp dụng sau: SiW  S i   i ,  i  [ i1 , ,  in ]  n vectơ thao tác Các thao tác bị Định nghĩa 1: Hàm giấu   : n   , với  tập hợp tham số bí mật định người chủ sở hữu liệu Ký hiệu Ý nghĩa m = 20 Số phân vùng Ks = 97 Khố bí mật H = MD5 Hàm băm Tập hợp  xem phần khố bí mật Chú ý hàm giấu áp dụng cho S i   i vectơ thao tác  i biến, S i  số Để mã hoá bit bi vào tập Si , thuật tốn mã hố bít làm tối ưu hoá hàm hàm giấu  (Si   i ) Mục đích tốn tối ưu hoá cực đại cực 3.2 Nhúng thuỷ vân Để nhúng thuỷ vân vào sở liệu phân hoạch, trình tiểu hàm giấu dựa vào bít bi : Nếu bít bi=1 thuật tốn mã hố bít giải tốn cực đại hố: nhúng tiến hành thơng qua bước mã hố bit đơn để xác định xem bit max chuỗi bit thuỷ vân nhúng vào phân vùng cụ thể Việc mã i hố việc thực giải tốn tối ưu hố có ràng buộc áp dụng giải thuật di truyền Sau trình nhúng, kết thu hai tập thống kê  ( S i   i ) thoả mãn ràng buộc Gi Nếu bít bi = tốn đơn giản chuyển thành toán cực tiểu hoá dùng để tính ngưỡng cho q trình giải mã thuỷ vân sau Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 35 - - 36 - Giải pháp cho toán tối ưu hoá sinh vectơ thao tác  i để *  ( S i   i *) tối ưu Khi đó, liệu S iW  S i   i * Việc cực đại hoá cho bi =1 cực tiểu hoá cho bi =0, đảm bảo giá trị hàm  (S i   i *) sinh hai trường hợp đặt vị trí có khoảng cách lớn làm cho bít chèn bền vững công, đặc biệt công thay đổi liệu tương ứng dòng thuật toán mã hoá Các thống kê dùng để tính tốn tham số giải mã tối ưu Tập hợp ràng buộc sử dụng Gi biểu diễn biên với thay đổi cho phép thực phần tử Si Các ràng buộc mô tả không gian khả thi cho vectơ thao tác  i với bước mã hố bít Các ràng buộc phụ thuộc vào ứng dụng liệu Ví dụ liệu mức tiêu thụ điện sinh hoạt có ràng buộc điểm cận để Thuật tốn mã hố bít đơn mơ tả sau: chuyển đổi mức giá tính phí tiêu thụ Với Việt Nam thời điểm (năm Algorithm: Encode_single_bit Input: Tập liệu Si, bit bi, tập ràng buộc Gi, tham số bí mật , tập thống 2009) mốc để tính phí tiêu thụ điện là: 50 KW, 100 KW, 150 KW, 200 KW kê Xmax, Xmin Các ràng buộc khoảng dùng để điều khiển độ lớn thay đổi Output: Tập liệu Si + *i cho  ij , tức là: If (|Si| <  ) then return Si min   ij  max ij ij If (bi = = 1) then maximize (  (Si   i ) ) phụ thuộc vào ràng buộc Gi insert  (S i   i *) into Xmax Kiểu ràng buộc thú vị khác yêu cầu liệu thuỷ vân trì thống kê Ví dụ, trung bình liệu sinh trung bình liệu gốc ràng buộc trường hợp có dạng: else n  minimize (  (Si   i ) ) phụ thuộc vào ràng buộc Gi j 1 ij 0 Một vài ràng buộc sử dụng khác tạo phụ thuộc vào insert  (S i   i *) into Xmin return Si + *i yêu cầu ứng dụng Các ràng buộc xử lý thuật tốn mã hố bít Thuật tốn mã hố bít nhúng bít bi vào phần Si |Si| >  dùng kỹ thuật tối ưu hố có ràng buộc Giá trị  biểu diễn kích cỡ phần cực tiểu Việc cực đại hoá cực tiểu hoá thuật tốn mã hố bít làm tối ưu hố hàm giấu  (S i   i *) thoả mãn ràng buộc Gi Các thống kê cực Hàm giấu sử dụng phụ thuộc vào thống kê liệu Các W giá trị trung bình phương sai liệu S i  S i   i tương ứng  ( S   )  (2S   ) ; gọi tắt i i i i   đại hoá cực tiểu hoá ghi lại cho bước mã hoá X max , X Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 37 - - 38 địi hỏi lượng tính tốn lớn Mục đích phương pháp tìm lời giải (phương án) gần tối ưu mà đảm bảo giá trị cực tiểu hoá hàm  c ( S i   i ) cực đại hoá hàm  c ( S i   i ) cách xa Điểm tham chiếu : ref    c   , c  (0,1) số thực bí mật, 3.2.2 Áp dụng giải thuật di truyền giải toán tối ƣu phần tập  Các điểm liệu S i   i ref đầu vào “tail”  c định nghĩa số đầu vào tail chuẩn hoá độ dài S i , tail count chuẩn hoá Hàm tính sau:  c (S i   i )  tắc chọn ngẫu nhiên trình chọn lọc tự nhiên Thay sử dụng thơng tin gradient, GA sử dụng trực tiếp hàm mục tiêu việc tìm kiếm Thuật tốn di truyền tìm kiếm khơng gian giải pháp cách trì giải n 1{s  ref } n j 1 ij ij pháp Sau đó, cách sử dụng hoạt động liên quan giao nhau, biến đổi, lựa chọn, thuật toán di truyền (GA) tạo hệ : n độ dài S i 1{} Thuật tốn di truyền (GA) kỹ thuật tìm kiếm dựa nguyên giải pháp thành công – hệ có kế thừa phát triển đặc tính tốt hàm định nghĩa sau: cha mẹ chúng chúng tới gần giải pháp tối ưu gần tối ưu Bằng việc sử dụng trực tiếp hàm mục tiêu tìm kiếm, thuật tốn di Nếu thoả mãn điều kiện {} truyền áp dụng cách có hiệu tốn khơng lồi, 1{} = Các trường hợp cịn lại khơng tuyến tính cao, phức tạp Thuật tốn di truyền tìm kiếm thường xuyên sử dụng để giải toán tối ưu hoá toán Chú ý tham chiếu ref phụ thuộc vào   , có nghĩa khơng cố định thay đổi tự động với thống kê S i   i Tail count  c (S i   i ) chuẩn hoá phụ thuộc vào phân phối S i   i tham chiếu động Hàm mục tiêu  c ( S i   i ) khơng tuyến tính khơng thể lấy vi phân, làm cho toán tối ưu hoá gần với toán tối ưu hố có ràng buộc khơng tuyến tính Các cách tiếp cận truyền thống dựa vào gradient áp dụng cho toán Thuật toán di truyền áp dụng để giải toán tối ưu hoá Việc giải toán tối ưu hố khơng tuyến tính kết hợp với ràng buộc hàm mục tiêu phức tạp Thuật tốn di truyền khơng bảo đảm tìm tối ưu tồn cục; nhiên đặt bẫy vị trí tối ưu phương pháp tìm kiếm truyền thống dựa vào gradient hàm mục tiêu khơng trơn nói chung tốt GA thường phân tích phần khơng gian giải pháp rộng phương pháp thơng thường tìm giải pháp khả thi tốn có ràng buộc nặng Bài tốn dành cho GA tìm kiếm khơng gian giả thuyết ứng cử để xác định giả thuyết tốt Trong GA “giả thuyết tốt nhất” định không thiết phải tìm lời giải tối ưu tồn cục việc tìm lời giải Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 39 - - 40 - nghĩa giả thuyết tối ưu hoá đại lượng số định nghĩa thành xâu ký hiệu gọi nhiễm sắc thể Một lược đồ biểu diễn nhị trước cho toán tới, gọi độ thích nghi giả thuyết phân đơn giản sử dụng ký hiệu {0, 1}; nhiễm sắc thể dài L ký hiệu Mặc dù thuật giải di truyền thực thay đổi theo toán cụ thể, chúng chia sẻ chung cấu trúc tiêu biểu sau: Thuật giải hoạt động Ví dụ nhiễm sắc thể nhị phân biểu diễn véctơ  i   i1 , ,  in  có dạng: cách cập nhật liên tục tập giả thuyết – gọi quần thể Ở lần lặp, tất cá thể quần thể ước lượng tương ứng với hàm thích nghi Rồi quần thể tạo cách lựa chọn có xác suất cá thể thích nghi tốt từ quần thể Một số cá thể chọn đưa nguyên vẹn vào quần thể Những cá thể khác dùng làm Mỗi thành phần  i sử dụng L n bít, với n = |Si| Biểu diễn nhiễm sắc thể tự động xử lý ràng buộc khoảng  i Ví dụ  ij sở để tạo cá thể cách áp dụng tác động di truyền: lai lấy giá trị khoảng [lij, hij], việc ánh xạ số nguyên ghép đột biến Các giả thuyết tạo cách áp dụng toán tử khoảng [0, 2L/n - 1] thành giá trị khoảng [lij, hij] qua tịnh tiến lai ghép cho cặp giả thuyết thích nghi cách tạo đột biến điểm đơn hệ giả thuyết kết Quá trình lặp đếm gộp đơn giản, điều đảm bảo hoạt động thực nhiễm sắc thể đó, đầu vào đảm bảo khoảng khả thi Mỗi nhiễm sắc thể có giá trị tương ứng với hàm mục tiêu, giả thuyết thích hợp phát Các giả thuyết GA thường thể dạng chuỗi bit, để chúng dễ dàng thực toán tử di truyền: đột biến lai ghép Các giả thuyết thể chuỗi bit phức tạp phù hợp nhiễm sắc thể Để xử lý loại ràng buộc khác, người ta phạt nhiễm sắc thể không khả thi cách làm giảm giá trị phù hợp chúng theo hàm phạt  (  i ) - hàm biểu diễn mức độ không khả thi Không Hàm thích nghi (hàm phạt) định nghĩa tiêu chuẩn để xếp hạng giả tính tổng qt, tốn tối ưu hoá giải với ràng buộc thuyết tiềm ẩn để chọn lọc chúng theo xác suất để đưa vào quần thể hệ Gi={gi1,…., gip}, hàm thích hợp sử dụng c ( Si   i )  ( i ) , Thường tiêu chuẩn khác bao hàm, chẳng hạn độ    hệ số phạt chọn đủ lớn để phạt hàm mục tiêu phức tạp mức độ tổng quát luật Một cách tổng quát hơn, giả thuyết trường hợp  i không khả thi chuỗi bit hiểu thủ tục phức tạp, hàm thích nghi đo hiệu suất tổng thủ tục kết hiệu suất luật riêng biệt Với toàn này, khả thi  i tập hợp giá trị  i làm thoả mãn tất ràng buộc Gi Thuật tốn di truyền tìm kiếm khơng làm Hàm phạt  (  i ) tính sau: p ( i )   g ij ( i ) j 1 đó: việc trực tiếp với điểm  i , có ánh xạ điểm  i Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 41 - - 42 i  k mod l Nếu  i thoả mãn ràng buộc gij  ij g ( i ) = S kw  encode_single_bit(bi, Sk, c, Xmax, Xmin) (gij,  i ) Trƣờng hợp lại insert S kw  Dw  ( g ij ,  i )   biểu diễn lượng không khả thi ràng buộc gij  Ví dụ ràng buộc gij  n j 1 T*  get_optimal_thershold(Xmax, Xmin)  ij   ( gij , i ) ||  j 1 ij || n return Dw, T* Thuật tốn di truyền dùng cho tối ưu cục Tuy nhiên, thuật toán di truyền yêu cầu lượng lớn đánh giá hàm cho hội tụ tới tối ưu toàn cục Như Thuật toán nhúng thuỷ vân sinh phần S , , S m 1  cách gọi vậy, thuật tốn di truyền sử dụng tìm kiếm thời gian xử lý hàm get_partitions, sau với phần S k bít thuỷ vân bi mã hố khơng địi hỏi xác (khắt khe) thuỷ vân thực độc lập cách sử dụng thuật tốn mã hố bít đơn (encode_single_bit) Phần thay đổi sinh S kW chèn vào liệu nhúng thuỷ vân 3.2.3 Thuật toán nhúng thuỷ vân Thuỷ vân l bít W=bl-1, , b0 nhúng vào phần liệu S , , S m 1  dụng thuật tốn get_optimal_threshold để tính tốn ngưỡng giải mã tối ưu Để việc nhúng thuỷ vân nhiều lần liệu, độ dài thuỷ vân l chọn cho: l  m *) Các giá trị thực nghiệm mà tác giả áp dụng luận văn : Watermark = 10101 ; //Chuỗi bit thuỷ vân dùng để nhúng Thuật toán nhúng thuỷ vân nhúng bít bi vào phần S k cho m k mod l  i Kỹ thuật đảm bảo bít thuỷ vân nhúng   lần l  liệu D Thuật tốn nhúng thuỷ vân mơ tả sau: c = 0.75; // Tham số bí mật c  = 10; // Kích thƣớc nhỏ phân vùng l=5 // Độ dài thuỷ vân 3.2.4 Đánh giá ngƣỡng giải mã Algorithm: embed_watermark Trong phần này, ta thảo luận kỹ thuật giải mã bít – kỹ thuật dùng Input: Tập liệu D, khố bí mật Ks, số phân vùng m, thuỷ vân W = {b0, …, bl-1} Output: Tập liệu nhúng thuỷ vân Dw, ngưỡng tối ưu giải mã T* Dw, Xmax, Xmin  {} để lấy bít thuỷ vân nhúng bi từ phần S iW Kỹ thuật giải mã bít dựa ngưỡng tối ưu T* để làm cực tiểu hoá xác suất xảy lỗi giải mã Với phần liệu S iW , kỹ thuật giải mã bít tính tốn hàm giấu   ( S iW ) S0, …., Sm-1  get_partition(D, Ks, m) so sánh với ngưỡng giải mã tối ưu T* để giải mã bít nhúng bi for each Partition Sk Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Các thống kê (Xmax, Xmin) thu thập sau bít nhúng sử http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 43 - - 44 - W Nếu   ( S i ) >T* bít giải mã 1, ngược lại bít giải mã Ví dụ: sử dụng hàm giấu mô tả phần trước, kỹ thuật giải mã tính tốn tail count chuẩn hố S W i cách tính tốn tham chiếu ref đếm số đầu vào S iW lớn ref Sau đó, tail count chuẩn hố so sánh với T* Giá trị ngưỡng T* nên tính tốn cẩn thận để làm cực tiểu hố xác suất xảy lỗi giải mã bít Để cực tiểu hoá xác suất lỗi giải mã ( Perr ) ngưỡng T, ta lấy đạo hàm cấp Perr T để xác định ngưỡng tối ưu T*, sau: Perr   P1 T T  T  f ( x | be  1)dx  P0  T   T f ( x | be  0)dx  P1 f (T | be  1)  P0 f (T | be  0) Các phân phối f ( x | be  0) f ( x | be  1) đánh giá từ thống kê tập hợp Xmin Xmax tương ứng Qua thí nghiệm Xmin Xmax , cho thấy phân phối f ( x | be  0) f ( x | be  1) có dạng chuẩn tắc Xác suất xảy lỗi giải mã bít định nghĩa xác suất (khả chúng đánh phân phối Gaussian N (  ,  ) năng) bít nhúng giải mã sai Ngưỡng giải mã tối ưu T* chọn để N (1 ,  ) cách tương ứng Tuy nhiên, phân tích sau làm cực tiểu hoá xác suất xảy lỗi giải mã Thời kỳ nhúng bít dựa việc thực với kiểu phân phối khác cực tiểu hoá cực đại hoá tail count; giá trị hàm giấu tối ưu hố tính tốn suốt thời kỳ mã hố để tính tốn ngưỡng tối ưu P0 đánh giá | X | , | X max |  | X | T* Các giá trị hàm giấu cực đại hoá tương ứng với bi = lưu tập P1   P0 Xmax Tương tự, giá trị hàm giấu cực tiểu hoá lưu trữ Xmin Thay biểu thức Gaussian cho f ( x | be  0) f ( x | be  1) , đạo hàm cấp Perr có dạng: Cho Perr , P0 P1 tương ứng xác suất xảy lỗi giải mã, xác suất mã hố bít =0, xác suất mã hố bít =1 Perr P0 (T   ) P1 (T  1 )  exp(  ) exp(  ) T 2 2 02  2  2 Cho be , bd , f (x) tương ứng bít mã hố, bít giải mã, Cho đạo hàm cấp Perr 0, ta phương trình bậc 2, có hàm mật độ xác suất thể tính giá trị ngưỡng tối ưu T* làm cực tiểu hoá Perr Đạo hàm cấp Perr Khi đó, Perr tính sau: Perr = P(bd  0, be  1)  P(bd  1, be  0) đánh giá T* để đảm bảo điều kiện ( = P(bd  | be  1) P1  P(bd  | be  0) P0  P    2   2  02   12  2 2 T *2  2 T *  ln   20  2 2   01 2   P1  = P( x  T | be  1) P1  P( x  T | be  0) P0 T   T Từ phân tích trên, việc chọn ngưỡng tối ưu T* dựa thống kê = P1  f ( x | be  1)dx  P0  f ( x | be  0)dx Số hóa Trung tâm Học liệu – Đại học Thái Nguyên  Perr (T *)  ) thoả mãn T kết thu thuật toán nhúng thuỷ vân Ngưỡng tối ưu T* làm cực http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 45 - - 46 - tiểu hoá xác suất xảy lỗi giải mã nâng cao độ bền thuỷ đơn giản tăng tốc độ xử lý tính tốn lập trình, tác giả tính tốn giá trị vân nhúng khả giải mã thành công tăng ngưỡng giải mã T* cách lấy giá trị trung bình tập thống kê Xmax Xmin này: + Lấy giá trị cực đại tập Xmin + Lấy giá trị cực tiểu tập Xmax T* = Min( X max )  Max( X ) Theo kết thực nghiệm tác giả nhận thấy rằng, ngưỡng giải mã T* phụ thuộc vào phân phối tập Xmax Xmin, phân phối hai tập cách xa làm cực tiểu hoá lỗi giải mã Điều phụ thuộc nhiều vào kỹ thuật áp dụng dùng để giải toán tối ưu hoá, kỹ thuật GA 3.3 Giải mã thuỷ vân Hình Thống kê phân bố tập Xmax, Xmin cách lấy ngưỡng T* Ở hình trên, đường chấm gạch nằm hai phân phối làm cực tiểu Thuật toán phát thuỷ vân lấy thuỷ vân nhúng nhờ tham số bí mật gồm có: KS, m,  , c, T Quá trình giải mã thuỷ vân thực thơng qua ba bước chính: hoá xác suất xảy lỗi giải mã Xác suất xảy lỗi giải mã phụ thuộc vào ràng buộc sử dụng Nếu ràng buộc sử dụng chặt lượng thay đổi cho liệu D khơng đủ cho chèn thuỷ vân Tất xác suất xảy lỗi giải mã thuỷ vân Phân hoạch, giải mã bầu chọn theo đa số + Phân hoạch tập liệu chứa thuỷ vân: Kỹ thuật phân hoạch trình bày kỹ phần [3.1] Đầu vào bao gồm: làm giảm cách nhúng thuỷ vân nhiều lần liệu đó, i) Bộ liệu thuỷ vân DW lặp lại mã sửa sai ii) Khố bí mật KS Sau nhiều lần chạy thử nghiệm kết giải mã, tác giả luận văn nhận thấy rằng, ngưỡng giải mã T* nằm miền thuộc phần giao hai phân phối giải mã bit giải mã bit Miền giao thường iii) Số phần phân hoạch m Bộ liệu đạt DW phần phân hoạch S , , S m 1  Mỗi phần chứa bit thuỷ vân đơn mã hố nằm ngồi khoảng tin cậy tính thống kê tập Xmax Xmin Vì vậy, để Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 47 - - 48 - + Giải mã để lấy bít nhúng: Sử dụng lược đồ giải mã ngưỡng dựa i  j mod l vào ngưỡng tối ưu T làm cực tiểu hoá xác suất xảy lỗi giải mã nói value  (Sj, 0, c) phần [3.2.4] Nếu kích cỡ phần liệu nhỏ  bít giải mã khơng if value  T* thực hiện, ngược lại giải mã nhờ lược đồ giải mã ngưỡng ones[i]  ones[i] + Thuỷ vân W  bl 1 , , b0 nhúng vài lần liệu, bít thuỷ 10 else vân lấy vài lần nơi mà bít bi lấy từ phần S k với k mod l  i 11 zeros[i]  zeros[i] + Các bít lấy giải mã nhờ kỹ thuật bầu chọn theo đa số Mỗi bít bi 12 for j = to l -1 lấy 13 if ones[j] > zeros[j] m lần l 14 WD[j]  + Kỹ thuật bầu chọn theo đa số: Bit bi định số lượng bit hay bit tổng số bit bi giải mã Ví dụ bit b2 nhúng 10 lần vào sở liệu, sau giải mã, kết giải mã thuỷ vân thu giả sử bit bit Vậy kết luận kỹ thuật bình chọn theo đa số bit b2 bit (b2 = 0) Với kỹ thuật bầu chọn theo đa số thuỷ vân nhận bền vững trước số công chèn thêm liệu, sửa đổi liệu, xố liệu, ngưỡng giải mã chọn tuân thủ theo nguyên lý xác suất thống kê nhằm làm cực tiểu hoá lỗi giải mã Thuật toán phát thuỷ vân sau: 15 else if ones[j] < zeros[j] 16 WD[j]  17 else 18 WD[j]  x 19 Return WD Trường hợp quan hệ đa thuộc tính đàn hồi ( bền vững) thuỷ vân tăng lên nhúng thuỷ vân nhiều thuộc tính 3.4 Kết thực nghiệm Algorithm: detect_watermark Input: Tập liệu thuỷ vân Dw, m, c,  , Ks, T , độ dài thuỷ vân l * Output: Chuỗi thuỷ vân nhúng WD Bộ liệu thực nghiệm luận văn liệu tự tạo giả định số liệu điện sinh hoạt vùng đó, liệu bao gồm 8000 Để cho đơn giản trình cài đặt thực nghiệm, giả sử Set ones[0, , l-1]  //Tập bit giải mã bit liệu bao gồm trường, trường khố quan hệ, trường Set zeros[0, , l-1]  //Tập bit giải mã bit trường chọn để nhúng thuỷ vân S0,…., Sm-1  get_pertitions(Dw, Ks, m) Các thơng số dùng cho q trình thí nghiệm bao gồm: for j = to m – + Hàm băm: MD5 if |Sj|   Số hóa Trung tâm Học liệu – Đại học Thái Ngun + Khố bí mật: KS = 97 http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 49 - - 50 - + Số phân vùng: m = 30 + Tỉ lệ giải mã thuỷ vân thành công kiểu công xố + Tham số bí mật c = 0.75 so với kiểu công thay đổi liệu + Chuỗi bit đem nhúng (watermark): 10101 i) + Kích cỡ nhỏ phân vùng:  = 10 Với số lượng cho phép xoá 30% tổng số tỉ lệ giải mã thành công 40% + Số cặp dùng cho trình sinh sản GA: cặp = 10 cá thể ii) + Số hệ tiến hoá: 50 Với 50% số bị xố tỉ lệ giải mã thành công/thất bại 15% + Tỉ lệ giải mã thuỷ vân thành công/thất bại kiểu công chèn + Số cá thể khởi tạo ngẫu nhiên ban đầu: 50 thêm vào sở liệu thấp + Ràng buộc thay đổi liệu:  8%% (0.008) Bộ liệu thiết kế chứa file định dạng Excel với tên i) Nếu chèn trung bình khoảng 7.5% đến 8% tổng số vào sở liệu tỉ lệ giải mã thành công 50% Data.xls Tác giả dùng Matlab 7.04 làm mơi trường cài đặt ứng dụng Thí nghiệm chạy hệ thống có cấu hình Intel Pentium IV ii) Nếu chèn thêm 10% (khoảng 12%) số lượng vào sở liệu tỉ lệ giải mã thành công 0% Các thông số bị thay đổi thay đổi thông số đầu Ghz, 512 MB Ram Sau nhiều lần chạy thử nghiệm tác giả nhận thấy, tốc độ giải mã thuỷ vào như: Tăng giảm khoảng thay đổi cho phép liệu nhúng vân nhanh gấp nhiều lần tốc độ nhúng thuỷ vân (trung bình từ 10 đến 15 thuỷ vân; độ ngẫu nhiên việc công (phá hoại); số lượng phân vùng lần) kèm với độ lớn liệu (tổng số bộ) Thử nghiệm với công kết sau: Thực công kiểu công 20 lần, lần tác động số lượng ghi khác nhau, kết thống kê bảng Căn vào bảng thống kê cơng sau q trình thực nghiệm tác giả có nhận xét sau: + Tỉ lệ thành cơng kiểu công thay đổi liệu cao Khi thay đổi thông số đầu vào khoảng cho phép liệu thay đổi 0.05, số lượng bị thay đổi 7500 (trên tổng số 8000 bộ) tương đương với 90% tổng số bị thay đổi tỉ lệ thành cơng giải mã thuỷ vân 60% (khoảng 63%) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 52 - KẾT LUẬN VÀ KIẾN NGHỊ Như vậy, để tiến hành thuỷ vân giải mã thuỷ vân sở liệu quan hệ, trình thực cần tiến hành qua hai phần nhúng thuỷ vân giải mã thuỷ vân nhúng Việc nhúng thuỷ vân thực thơng qua ba bước nhỏ là: Phân hoạch liệu, nhúng thuỷ vân vào phân hoạch tính tốn ngưỡng tối - 51 - ưu giải mã Loại cơng Xố Chèn Sửa Số ghi bị tác động Thành công (lần) Thất bại (lần) Thành công (lần) Thất bại (lần) Thành công (lần) Thất bại (lần) + Mục đích phân hoạch chia nhỏ liệu thành nhóm 100 200 300 500 600 20 20 20 20 20 20 18 20 20 20 17 18 18 10 10 19 1000 1500 2000 14 20 17 14 20 19 13 20 18 2500 3000 4000 5000 6000 7000 7500 ghi (phân hoạch) cho nhóm ghi chọn sở 12 20 18 16 20 18 17 20 16 19 20 12 20 20 11 20 20 11 20 20 12 liệu ngẫu nhiên Để tăng tính ngẫu nhiên đảm bảo tính bí mật Bảng Thống kê công với số lần công 20 trình lựa chọn ghi phân vào phân vùng trình phân hoạch thực với hàm băm mật mã (HMAC) Một số dạng hàm băm đáp ứng tiêu chí áp dụng MD5, SHA-0, SHA1… Việc lựa chọn hàm băm có ảnh hưởng đến tốc độ tính toán phân hoạch liệu, điều tuỳ thuộc vào số word lựa chọn sử dụng hàm băm + Việc nhúng thuỷ vân tính tốn cách hợp lý để đảm bảo thay đổi liệu giới hạn cho phép Thuật tốn GA Số hóa Trung tâm Học liệu – Đại học Thái Nguyên áp dụng phần nhằm tính tốn giá trị tối ưu để chèn bit vào http://www.lrc-tnu.edu.vn phân hoạch Việc giải toán tối ưu áp dụng giải thuật GA nhằm đưa hai tập thống kê Xmax Xmin cho phân phối hai tập cách xa nhau, điều giúp làm cực tiểu hoá lỗi giải mã, đồng thời điểm mấu chốt giúp cho kỹ thuật thuỷ vân đàn hồi trước công thông thường + Căn vào hai tập thống kê Xmax Xmin lưu lại trình nhúng bit thuỷ vân, nguyên tắc xác suất thống kê áp dụng để tính tốn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 53 - - 54 - ngưỡng giải mã tối ưu cho toán Việc chọn ngưỡng giải mã tối ưu PHỤ LỤC có ảnh hưởng lớn đến tính xác trình giải mã, đặc biệt trường hợp liệu thuỷ vân bị công Các hàm băm ứng dụng nhiều lĩnh vực, chúng thường Quá trình giải mã thuỷ vân thực qua ba bước là: Phân thiết kế phù hợp với ứng dụng Một hàm băm tốt phép biến đổi hoạch liệu nhúng thuỷ vân, giải mã thuỷ vân, bình chọn theo đa "một chiều", nghĩa khơng có phương pháp thực tiễn để tính tốn số Trong q trình giải mã thuỷ vân sử dụng số tham số liệu vào tương ứng với giá trị băm mong muốn, việc giả trình nhúng thuỷ vân tham số bí mật (số phần phân hoạch, khố bí mạo khó khăn Một hàm chiều mật mã học điển hình khơng có tính mật), tập thống kê Xmax, Xmin Với kỹ thuật giải mã dùng phương pháp chất hàm đơn ánh tạo nên hàm băm hiệu bình chọn theo đa số q trình giải mã khơng cần thơng tin liệu gốc giải mã thuỷ vân nhúng Các hàm băm dành cho việc phát sửa lỗi tập trung phân biệt trường hợp mà liệu bị làm nhiễu trình ngẫu nhiên Khi Mặc dù kỹ thuật thuỷ vân sử dụng GA để giải toán tối ưu hàm băm dùng cho giá trị tổng kiểm, giá trị băm tương đối nhỏ có trường hợp phù hợp, nhiên kỹ thuật GA áp dụng thể dùng để kiểm chứng file liệu có kích thước tùy ý chưa ứng dụng với tốn khơng lồi, khơng tuyến tính cao khơng bị sửa đổi Hàm băm dùng để phát lỗi truyền liệu Tại nơi gửi, yêu cầu khắt khe thời gian tính toán Kỹ thuật GA cần nghiên hàm băm tính cho liệu gửi, giá trị băm gửi cứu thêm để cải tiến tốc độ tính tốn làm giải vấn đề tối ưu liệu Tại đầu nhận, hàm băm lại tính lần nữa, giá trị băm khơng hố tốt trùng lỗi xảy q trình truyền Việc Hướng nghiên cứu để phát triển đề tài theo tác giả đề nghị là: gọi kiểm tra dư (redundancy check) + Cải tiến hàm giấu để GA hội tụ nhanh nhằm làm tăng tốc độ nhúng thuỷ vân * Hàm băm MD5 (Message-Digest algorithm 5) + Cải tiến cách sinh sản cá thể quần thể để GA có kết tối ưu tốt MD5 hàm băm để mã hoá với giá trị băm 128bit Từng xem chuẩn Internet, MD5 sử dụng rộng rãi + Cải tiến hàm đánh giá GA để có đa dạng cá thể quần thể GA nhằm thu cá thể tốt sau lần tiến hoá + Nghiên cứu giải pháp để tránh trường hợp tối ưu cục (giả tối ưu) chương trình an ninh mạng, thường dùng để kiểm tra tính nguyên vẹn tập tin MD5 thiết kế Ronald Rivest vào năm 1991 để thay cho hàm băm trước đó, MD4 (cũng ơng thiết kế, trước MD2) MD5 có ứng dụng quan trọng: 1/ MD5 sử dụng rộng rải giới phần mềm để đảm bảo Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 55 - - 56 - tập tin tải khơng bị hỏng Người sử dụng so sánh thơng số Hình bên mơ tả q trình vịng Có hàm chiều F kiểm tra phần mềm MD5 cơng bố với thơng số kiểm tra phần mềm sử dụng Mỗi vòng sử dụng hàm khác tải MD5 2/ MD5 dùng để mã hố mật Mục đích việc mã hố biến đổi chuổi mật thành đoạn mã khác, cho từ đoạn mã khơng thể lần trở lại mật Có nghĩa việc giải mã phải khỗng thời gian dài (đủ để làm nản lịng kẻ công) Thuật giải MD5 biến đổi thông điệp có chiều dài thành khối có kích thước cố định 128 bits Thơng điệp đưa vào cắt thành khối 512 bits Thông điệp đưa vào đệm để chiều dài chia hết cho 512 Bộ đệm hoạt động sau: - Trước tiên chèn bit vào cuối thơng điệp - Tiếp hàng loạt bit Zero chiều dài nhỏ bội Hàm băm MD5 (cịn gọi hàm tóm tắt thông điệp - message degests) trả chuỗi số thập lục phân gồm 32 số liên tiếp Dưới số 512 khoảng 64 bit - Phần lại lấp đầy số nguyên 64 bit biểu diễn ví dụ mô tả kết thu sau băm chiều dài ban đầu thơng điệp Thuật tốn MD5 hoạt động 128 bit Chia nhỏ thành từ 32 bit, kí hiệu A,B,C D Các giá trị số MD5("K6CH") = 56861ffa22479429ba47cffeca03304e MD5("k6ch") = 11df758de80935b75b2a7bc1479aa164 cố định Sau thuật tốn ln phiên hoạt động khối 512 bit Mỗi khối phối hợp với Q trình xữ lý khối thơng điệp bao gồm bước tương tự nhau, gọi vịng (“round”) Mỗi vịng lại gồm 16 q trình tương tự dựa hàm chiều F, phép cộng module phép xoay trái… Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 57 - - 58 - TÀI LIỆU THAM KHẢO [1] [11] R Sion, “Proving ownership over categorical data” ICDE 2004 [12] E Bertino, B.C Ooi, Y.Yang, and R Deng, “Privacy and ownership “Nghiên cứu Phát triển Kỹ thuật Thuỷ vân Cơ sở Dữ liệu Quan hệ”, Báo cáo kết nghiên cứu đề tài sở 2008, 12/2008, Phòng CSDL preserving of outsourced medical data” ICDE 2005 [13] Categorical Data Using Fragile Watermarks” DRM 2004 & LT [2] Bùi Thế Hồng, Nguyễn Thị Thu Hằng, Lƣu Thị Bích Hƣơng, “Thủy [14] [15] Nguyên, 2009 [4] [16] [17] Hoàng Kiếm, “Giải thuật di truyền - Cách giải tốn tự nhiên [18] Nguyễn Đình Thúc, “Trí tuệ nhân tạo – Lập trình tiến hố”, Nhà xuất [19] R Agrawal, J Kiernan, “Watermarking Relational Databases” in [20] R Agrawal, P J Haas, and J Kiernan “Watermarking relational data: [21] [10] R Sion, M Atallah, S Prabhakar.“Watermarking R Sion, M Atallah, and S Prabhakar, “Resilient Rights Protection for Sensor Streams” VLDB 2004 framework, algorithms and analysis*” The VLDB Journal (2003) [9] J Guo, Y Li, R Deng, and K Chen, “Rights Protection for Data Cubes” ISC 2006 Proceedings of the 28th VLDB Conference, Hong Kong, China, 2002 [8] Y Li, V Swarupand S Jajodia, “Constructing a Virtual Primary Key for Fingerprinting Relational Data” DRM 2003 Giáo dục [7] Y Li and R Deng, “Publicly Verifiable Ownership Protection for Relational Databases” ASIACCS 2006 máy tính”, NXB Khoa học kỹ thuật, 2000 [6] Y Li, H Guo, and S Wang, “A Multi-Bit Watermark for Relational Data” JDM 2007 ứng dụng CNTT, NXB KHKT Hà Nội, 2004 [5] Y Li, V Swarup, and S Jajodia, “Fingerprinting Relational Databases: Schemes and Specialties” TDSC 2005 Vũ Ba Đình, Nguyễn Xuân Huy, “Thuộc tính chẵn lẻ áp dụng kỹ thuật giấu tin bền vững”, Kỷ yếu Hội thảo FAIR: Nghiên cứu R Sion, M Atallah, and S Prabhakar, “Rights Protection for Relational Data” SIGMOD 2003 Vũ Ba Đình, “Giấu thông tin sở liệu không gian”, Tạp chí nghiên cứu khoa học kỹ thuật cơng nghệ Quân sự, số 4, 30-37 H Guo, Y Li, A Liu, and S Jajodia, “A Fragile Watermarking Scheme for Detecting Malicious Modifications of Database Relations” IS 2006 vân sở liệu quan hệ”, Tạp chí Khoa học & Công nghệ, ĐH Thái [3] Y Li, H Guo, and S Jajodia, “Tamper Detection and Localization for Relational [22] M Shehab, E Bertino, A Ghafoor “Watermarking Relational Databases” CERIAS TR 2002-28* Center for Education and Research in Databases using Optimization Based Techniques” CERIAS Tech Report Information Assurance, Computer Sciences, Purdue University, 2002 2006-41 R Sion, M Atallah, and S Prabhakar “Rights Protection for Relational Data” IEEE Transactions on Knowledge and Data MichaelArnold, MartinSchmucker, StephenD.Wolthusen, “Techniques and Applications of Digital Watermarking and ContentProtection”, ISBN1-58053-111-3, Tr 15-53, 2003 Engineering, 16(6), June 2004 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên [23] http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn - 59 [24] Saraju P Mohanty, “Digital Watermarking : A Tutorial Review”, Dept of Comp Sc and Eng, Unversity of South Florida 2001 [25] J.J Eggers, “Information embedding and digital watermarking”, Standford University, 2002 [26] Juergen Seitz University of Cooperative Education Heidenheim, Germany, “Digital watermarking for digital media”, ISBN 1-59140-520-3 Tr 1-35 [27] YingjiuLi, “Database Watermarking: A Systematic View”, 2008 [28] http://www.pcworld.com.vn/pcworld/magazine.asp?t=mzdetail&atcl_id=5 f5e5c5b595f5e [29] http://www.cs.stonybrook.edu/~sion/research/ [30] www.watermarkingworld.org Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Ngày đăng: 11/10/2016, 20:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan