bảo vệ bản quyền cơ sở dữ liệu bằng thủy vân ảnh số

48 685 1
bảo vệ bản quyền cơ sở dữ liệu bằng thủy vân ảnh số

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Phạm Thị Thu Hường BẢO VỆ BẢN QUYỀN CƠ SỞ DỮ LIỆU BẰNG THUỶ VÂN ẢNH SỐ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẤN KHOA HỌC: TS BÙI THẾ HỒNG Thái nguyên - 2010 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 MỤC LỤC Chương 1 TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ 1 1.1 Một số khái niệm cơ bản 4 1.1.1 Thuỷ vân là gì ? 6 1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ? 7 1.1.3 Sự cần thiết của các kỹ thuật thuỷ vân CSDL quan hệ 8 1.2 Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ 10 1.2.1 Khả năng có thể phát hiện (Detectability) 11 1.2.2 Tính bền vững (Robustness) 11 1.2.3 Cập nhật phần tăng thêm (Incremental Updatability) 12 1.2.4 Không dễ cảm nhận được (Imperceptibility) 12 1.2.5 Hệ thống mù ( Blind System) 12 1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ 13 1.3.1 Cập nhật thông thường 13 1.3.2 Tấn công có chủ đích 13 1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ 15 1.4.1 Bảo vệ bản quyền hoặc chứng minh quyền sở hữu 15 1.4.2 Nhận thực thông tin (Authentication) 15 1.5 Các kỹ thuật thủy vân cơ sở dữ liệu quan hệ 16 Chương 2 THỦY VÂN SỬ DỤNG CÁC BIT LSB 17 2.1 Chuẩn bị thuật toán 17 2.1.1 Đặt vấn đề 17 2.1.2 Các bít ít ý nghĩa nhất 18 2.1.3 Mã chứng thực thông điệp 19 2.2 Các thuật toán 19 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2 2.2.1 Mô hình thuỷ vân 20 2.2.2 Thuật toán nhúng thuỷ vân 20 2.2.3 Thuật toán phát hiện thuỷ vân 24 2.2.4 Một số lưu ý 26 2.2.5 Các quan hệ không có các khóa chính 27 2.3 Phân tích đánh giá thuật toán 28 2.3.1 Xác suất nhị thức tích luỹ 28 2.3.2 Hàm ngưỡng 29 Chương 3 THỦY VÂN SỬ DỤNG CÁC BIT Ý NGHĨA NHẤT 31 4.1 Giới thiệu 31 4.1.1 Mô hình thủy vân 32 4.1.2 Xác định bài toán 32 4.1.3 Lựa chọn các tập hợp con 33 4.2 Nhúng thủy vân 34 4.2.1 Mã hoá bít đơn 34 4.3 Phát hiện thủy vân 37 Chương 4 CÀI ĐẶT THỬ NGHIỆM 39 Kết luận 42 Tài liệu tham khảo 43 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 Lời nói đầu I. Lý do chọn đề tài Bảo vệ bản quyền, nhận thực thông tin, nhận dạng các đặc trưng duy nhất của dữ liệu quan hệ hiện đang là một nhu cầu cấp thiết và là thách thức mới đối với các kỹ thuật thuỷ vân trên cơ sở dữ liệu quan hệ. Việc quản lý bản quyền các dữ liệu quan hệ bằng thuỷ vân đã và đang trở thành một chủ đề quan trọng trong các nghiên cứu về cơ sở dữ liệu. Thuỷ vân các dữ liệu quan hệ có những thách thức kỹ thuật đáng kể và có các ứng dụng thực tế có ý nghĩa xứng đáng được quan tâm thích đáng từ phía cộng đồng những người nghiên cứu cơ sở dữ liệu. Thực sự, qua nghiên cứu và thử nghiệm tôi thấy việc phát triển và cài đặt các kỹ thuật thủy vân cơ sở dữ liệu rất phức tạp và rất khó để thỏa mãn được những yêu cầu khắt khe của lĩnh vực bảo vệ bản quyền đối với loại dữ liệu này. Những kết quả được trình bày trong báo cáo này là những tìm hiểu và nghiên cứu bước đầu của tôi trong lĩnh vực mới này. Chắc chắn là trong báo cáo này còn có nhiều khiếm khuyết. Tôi mong rằng sẽ nhận được những ý kiến góp ý xác đáng giúp tôi có được kết quả tốt hơn. Trong thời gian tới, tôi hy vọng sẽ có cơ hội tiếp tục thực hiện hướng nghiên cứu mới này và có thể đạt được những kết quả sâu hơn và tốt hơn. II. Mục đích nghiên cứu  Tìm hiểu các kỹ thuật thuỷ vân bảo vệ bản quyền cơ sở dữ liệu quan hệ.  Cài đặt thử nghiệm thủy vân trên cơ sở dữ liệu quan hệ dựa vào các bit LSB và MSB. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2 III. Nhiệm vụ nghiên cứu  Hiểu rõ cơ sở lý luận và toán học của các kỹ thuật giấu tin và các kỹ thuật thuỷ vân.  Phát triển các chương trình cài đặt lược đồ thuỷ vân bảo vệ bản quyền cơ sở dữ liệu quan hệ. IV. Phạm vi nghiên cứu  Nghiên cứu, đánh giá các kỹ thuật thuỷ vân.  Các công cụ lập trình và phần mềm dùng để cài đặt các lược đồ nhúng và giải thuỷ vân. V. Phương pháp nghiên cứu  Sưu tầm tìm hiểu các tài liệu, các kết quả nghiên cứu về giấu tin và thuỷ vân.  Đánh giá các kỹ thuật thuỷ vân đã biết  Cải tiến, mở rộng các kỹ thuật thuỷ vân đã biết nhằm mục đích thu được kết quả tốt hơn.  Cài đặt thử nghiệm trên những cải tiến được đưa ra. VI. Nội dung nghiên cứu và bố cục luận văn Luận văn được chia thành bốn chương: Chương 1: Tổng quan về thuỷ vân cơ sở dữ liệu quan hệ 1.1 Một số khái niệm cơ bản 1.2 Yêu cầu cơ bản của thuỷ vân cơ sở dữ liệu quan hệ 1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ 1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ 1.5 Các kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 Chương 2: Thuỷ vân sử dụng các bit LSB 2.1 Chuẩn bị thuật toán 2.2 Các thuật toán 2.3 Phân tích đánh giá thuật toán Chương 3: Thuỷ vân sử dụng các bit MSB 3.1 Giới thiệu 3.2 Nhúng thuỷ vân 3.3 Phát hiện thuỷ vân Chương 4: Cài đặt thử nghiệm Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4 Chương 1: TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở hai khía cạnh. Một là bảo vệ cho dữ liệu đem giấu và hai là bảo vệ cho chính đối tượng được sử dụng để giấu tin. Tương ứng với hai khía cạnh đó chúng ta có hai khuynh hướng kỹ thuật rõ ràng đó là giấu tin mật (Steganography) mà chúng ta đã tìm hiểu trong các chương trước) và thuỷ vân số (Watermarking). Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp (Message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân (Watermark). Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo nào đó. Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép v.v…Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng có những tính năng khác biệt tương ứng: Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 5 Hình 1. Phân loại các kỹ thuật thuỷ vân Các kỹ thuật thuỷ vân trên Hình 1 được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó. Thuỷ vân “dễ vỡ” (Fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ). Các kỹ thuật thuỷ vân có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin (Authentication) và phát hiện xuyên tạc thông tin (Tamper detection). Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiển. Thuỷ vân hiển là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5… Robust Copyright marking Thuỷ vân bền vững ImperceptibleWatermar king Thuỷ vân ẩn Watermarking Thuỷ vân số Fragile Watermarking Thuỷ vân “dễ vỡ” Visible Watermarking Thuỷ vân hiện Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 6 1.1 Một số khái niệm cơ bản 1.1.1 Thuỷ vân là gì ? Từ “thuỷ vân” có xuất xứ từ kỹ thuật đánh dấu nước thời xưa. Đây là kỹ thuật đánh dấu chìm một hình ảnh, một logo, hay một dữ liệu nào đó lên trên giấy nhằm mục đích trang trí và phân biệt được xuất xứ của sản phẩm giấy. Như vậy, thông tin cần giấu được gọi là thuỷ vân (Watermark). Thuỷ vân có thể là một chuỗi các ký tự, hay một hình ảnh, logo nào đó. Thuỷ vân mô tả thông tin có thể được dùng để chứng minh quyền sở hữu hoặc chống xuyên tạc. Có hai loại thuỷ vân, đó là : thuỷ vân bền vững và thuỷ dễ vỡ.  Thuỷ vân bền vững (Robust watermark): là thuỷ vân tồn tại bền vững cùng với dữ liệu, không dễ dàng bị phá huỷ trước những biến đổi, tấn công lên dữ liệu. Các kỹ thuật này thường được dùng trong các ứng dụng bảo vệ bản quyền, chứng minh quyền sở hữu.  Thuỷ vân dễ vỡ (Fragile watermark): là thuỷ vân dễ bị biến đổi trước những biến đổi hay tấn công lên dữ liệu. Các kỹ thuật này thường được dùng trong các ứng dụng nhận thực thông tin, đảm bảo tính toàn vẹn dữ liệu. Các kỹ thuật thuỷ vân ngay từ khi mới ra đời đã nhận được sự quan tâm rất lớn của các nhà khoa học. Các kỹ thuật thuỷ vân này đã được nghiên cứu và áp dụng trong nhiều môi trường dữ liệu khác nhau như: dữ liệu đa phương tiện (image, text, audio, video, . . .), hay các phẩm phần mềm, và gần đây là những nghiên cứu trên môi trường cơ sở dữ liệu quan hệ. Trong các môi trường dữ liệu đó thì dữ liệu đa phương tiện (đặc biệtt là image) được nghiên cứu và áp dụng sớm nhất và là môi trường chiếm tỷ lệ chủ yếu. Tuy nhiên, Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 7 hiện nay người ta đang tập trung nghiên cứu các kỹ thuật thuỷ vân trên cơ sở dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ cơ sở dữ liệu đó là muốn bảo vệ chúng trước những tấn công bên ngoài, . . . 1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ? Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày càng tăng lên đang tạo ra một nhu cầu tương tự đối với thủy vân cơ sở dữ liệu. Internet hiện đang đưa đến một sức ép rất nặng nề cho những người bảo vệ dữ liệu trong việc tạo ra các dịch vụ (thường được gọi là các dịch vụ web hoặc các tiện ích điện tử) cho phép người sử dụng tìm kiếm và truy cập cơ sở dữ liệu từ xa. Mặc dù xu hướng này là hữu ích cho người dùng cuối nhưng nó cũng bộc lộ một mối nguy hiểm cho những nhà cung cấp dữ liệu trước những kẻ trộm cắp dữ liệu. Do đó, những người cung cấp dữ liệu đòi hỏi phải có công nghệ nhận dạng được những bản sao các cơ sở dữ liệu của họ bị đánh cắp. Cho dù có khá nhiều điều có thể học hỏi được từ các kết quả đã đạt được về thủy vân dữ liệu đa phương tiện nhưng cho đến nay vẫn còn rất nhiều thách thức kỹ thuật mới đối với lĩnh vực thủy vân các cơ sở dữ liệu quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phương tiện khác nhau ở khá nhiều khía cạnh quan trọng. Chẳng hạn như, các phần khác nhau của một đối tượng đa phương tiện không thể cắt bỏ hoặc thay thế một cách tùy ý mà không gây ra những thay đổi về cảm quan trong đối tượng. Ngược lại, việc thêm, bớt và cập nhật các bộ của một bảng quan hệ lại là những phép toán chuẩn trong cơ sở dữ liệu. Do những khác nhau này mà các kỹ thuật được phát triển cho các dữ liệu đa phương tiện không thể được sử dụng trực tiếp để thủy vân các quan hệ. [...]... thuỷ vân cơ sở dữ liệu quan hệ 1.4.1 Bảo vệ bản quyền hoặc chứng minh quyền sở hữu Ngày nay, việc bảo vệ bản quyền hoặc chứng minh quyền sở hữu (Copyright Protection or Proving Ownership) đối với các nguồn cơ sở dữ liệu quan hệ ở bên ngoài là một vấn đề quan trọng trong các môi trường ứng dụng dựa vào Internet và trong nhiều ứng dụng phân phối dữ liệu Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân. .. thay đổi Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 16 1.5 Các kỹ thuật thủy vân cơ sở dữ liệu quan hệ Thuỷ vân trên cơ sở dữ liệu quan hệ là một kỹ thuật mới và rất phức tạp Cho đến nay mới chỉ có một vài cách tiếp cận bài toán thuỷ vân cơ sở dữ liệu quan hệ Việc lựa chọn kỹ thuật nào là tuỳ thuộc vào yêu cầu của ứng dụng Một số kỹ thuật thuỷ vân trên cơ sở dữ liệu quan... H(K o H(K o r.P)) Input: Khoá bí mật K chỉ có chủ cơ sở dữ liệu biết, và các tham số  ,  ,  cũng được chủ cơ sở dữ liệu xác định Output: Bộ dữ liệu được thuỷ vân // Khóa bí mật K, chỉ có chủ cơ sở dữ liệu biết Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 21 // Các tham số ,  và  cũng là của riêng chủ cơ sở dữ liệu 1) for each tuple r  R do if (F(r.P ) mod  equals...8 Thuỷ vân cơ sở dữ liệu quan hệ là phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu quan hệ Thuỷ vân cơ sở dữ liệu quan hệ là thuỷ vân ẩn, bền vững Một thuỷ vân có thể được áp dụng cho bất kỳ một cơ sở dữ liệu quan hệ nào có các thuộc tính mang một đặc điểm là những thay đổi nhỏ tại một số giá trị của chúng không làm ảnh hưởng đến các ứng dụng Ví dụ, dữ liệu khí tượng được... thủy vân được gọi là blind (mù) nếu khi phát hiện thủy vân người ta không cần đến dữ liệu gốc và cả thủy vân gốc Thuật toán phát hiện thủy vân được trình bày trên đây là thuật toán blind vì nó chỉ đơn thuần trích ra  bít thông tin từ dữ liệu mà không đòi hỏi phải truy cập dữ liệu gốc hoặc thủy vân gốc trước khi đi đến quyết định Thủy vân blind là rất quan trọng đối với các quan hệ trong cơ sở dữ liệu. .. giá trị bít đã nhúng và xây dựng lại thủy vân 3 Sử dụng lược đồ chọn theo đa số để tìm lại thủy vân giống với thủy vân gốc nhất 3.1.1 Mô hình thủy vân Thuỷ vân W=(100100100….) Nhúng thuỷ vân Dữ liệu được thuỷ vân, RW Kênh tấn công Dữ liệu bị tấn công , R’W Phát hiện thuỷ vân Dữ liệu, R Khoá bí mật, K Thuỷ vân được phát hiện W R=(100100100….) Hình 6: Mô hình thủy vân sử dụng các bít ý nghĩa nhất 3.1.2... cơ sở dữ liệu không bị mất thuỷ vân ngay trong dữ liệu bị kẻ khác ăn trộm, thậm chí đối với những cập nhật của tên trộm đó 1.3.2 Tấn công có chủ đích A có thể biết dữ liệu anh ta ăn trộm có chứa thủy vân, nhưng anh ta có thể cố xóa thủy vân này hoặc thử dùng các phương tiện khác để đòi quyền sở hữu trái phép Hệ thống đánh dấu cần phải bảo vệ B trước những tấn công gây hại của A Nghĩa là các cơ sở dữ. .. thuỷ vân) mang ý nghĩa quyền sở hữu sẽ được nhúng vào trong dữ liệu quan hệ Thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp cơ sở dữ liệu đó có và được dùng làm minh chứng cho bản quyền sản phẩm 1.4.2 Nhận thực thông tin (Authentication) Một tập thông tin sẽ được giấu trong cơ sở dữ liệu quan hệ Sau đó, các thông tin này sẽ được sử dụng để nhận biết xem dữ liệu gốc có bị thay đổi hay không Bằng. .. chất này rất quan trọng vì nó cho phép có thể phát hiện thuỷ vân trong bản sao của quan hệ cơ sở dữ liệu cho dù quan hệ gốc đã được cập nhật Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 13 1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ Vì các quan hệ cơ sở dữ liệu luôn được cập nhật nên các thuỷ vân được giấu trong một quan hệ có thể bị mất do những cập nhật... kiểu đơn giản thì rất khó áp dụng 1.2 Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ Chúng ta có thể thấy rằng thủy vân các dữ liệu quan hệ có những thách thức kỹ thuật đáng kể và có các ứng dụng thực tế có ý nghĩa xứng đáng được quan tâm thích đáng từ phía cộng đồng những người nghiên cứu cơ sở dữ liệu Cần phải xác định một hệ thống thủy vân và kèm theo đó là phát triển các kỹ thuật nhất . Tổng quan về thuỷ vân cơ sở dữ liệu quan hệ 1.1 Một số khái niệm cơ bản 1.2 Yêu cầu cơ bản của thuỷ vân cơ sở dữ liệu quan hệ 1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ 1.4. thuật thủy vân cơ sở dữ liệu quan hệ Thuỷ vân trên cơ sở dữ liệu quan hệ là một kỹ thuật mới và rất phức tạp. Cho đến nay mới chỉ có một vài cách tiếp cận bài toán thuỷ vân cơ sở dữ liệu quan. thiết của người chủ cơ sở dữ liệu đó là muốn bảo vệ chúng trước những tấn công bên ngoài, . . . 1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ? Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng

Ngày đăng: 04/10/2014, 06:36

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan