nghiên cứu phụ thuộc mạnh trong cơ sở dữ liệu

72 466 1
nghiên cứu phụ thuộc mạnh trong cơ sở dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MẠNH HÀ NGHIÊN CỨU PHỤ THUỘC MẠNH TRONG CƠ SỞ DỮ LIỆU Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC GS.TS. VŨ ĐỨC THI Thái Nguyên - 2014 ii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ LỜI CAM ĐOAN Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân tôi, không sao chép của ai do tôi tự nghiên cứu, đọc, dịch tài liệu, tổng hợp và thực hiện. Nội dung lý thuyết trong trong luận văn tôi có sử dụng một số tài liệu tham khảo như đã trình bày trong phần tài liệu tham khảo. Chương trình phần mềm và những kết quả trong luận văn là trung thực và chưa được công bố trong bất kỳ một công trình nào khác. Thái Nguyên, ngày7 tháng 6 năm 2014 Học viên thực hiện Lê Mạnh Hà iii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến GS.TS Vũ Đức Thi người đã tận tình hướng dẫn, chỉ bảo, giúp đỡ em trong suốt quá trình làm luận văn. Em cũng xin gửi lời cảm ơn đến các giảng viên trường Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên, các thầy Viện Công nghệ thông tin đã truyền đạt những kiến thức và giúp đỡ em trong suốt quá trình học của mình. Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và bạn bè những người đã ủng hộ, động viên tạo mọi điều kiện giúp đỡ để tôi có thể hoàn thành tốt luận văn. Tôi cũng xin gửi lời cảm ơn tới Ban giám hiệu Trường Cao đẳng Sư phạm Quảng Ninh đã tạo kiện thuận lợi cho tôi tham gia khóa học và trong suốt quá trình hoàn thành luận văn. Một lần nữa, xin chân thành cảm ơn. Thái Nguyên, ngày 7 tháng 6 năm 2014 Học viên thực hiện Lê Mạnh Hà iv Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ MỤC LỤC Lời cam đoan i Lời cảm ơn ii Mục lục iii Phần mở đầu v Bảng các kí hiệu vii Bảng các hình vẽ viii Chƣơng 1: Phụ thuộc hàm 1 1.1. Định nghĩa 1 1.2. Hệ tiên đề ArmStrong 3 1.3. Bao đóng của tập phụ thuộc hàm và tập thuộc tính 4 1.4. Khoá tối thiểu của sơ đồ quan hệ và quan hệ 7 1.5. Các dạng chuẩn 9 1.6. Hệ Sperner 11 1.7. Các dạng tương đương của họ phụ thuộc hàm 17 1.8. Kết luận 19 Chƣơng 2: Phụ thuộc mạnh và một số tính chất đặc trƣng của phụ thuộc mạnh 20 2.1. Định nghĩa 20 2.2. Hệ tiên đề phụ thuộc mạnh 21 2.3. Bao đóng của tập phụ thuộc mạnh và tập thuộc tính 22 2.4. Khoá tối thiểu của sơ đồ mạnh và quan hệ 25 2.5. Các dạng tương đương của họ phụ thuộc mạnh 25 2.6. Một số tính chất cơ bản của bao đóng của tập thuộc tính 27 2.7. Thuật toán tính bao đóng của tập thuộc tính trên quan hệ 29 2.8. Họ các tập tối thiểu 31 2.9. Quan hệ ArmStrong của phụ thuộc mạnh 34 v Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 2.9.1. Sự tồn tại của quan hệ ArmStrong 34 2.92. Các thuật toán 38 2.9.3. Một số bài toán quan trọng 42 2.10. Kết luận 43 Chƣơng 3: Cài đặt một số thuật toán về phụ thuộc mạnh trong CSDL 45 3.1. Lựa chọn bài toán. 45 3.2 Thuật toán sử dụng trong chương trình 46 3.3.Cài đặt chương trình 48 3.4.Một số mã lệnh 49 3.5. Hướng dẫn sử dụng chương trình. 56 3.6Chương trình minh họa 57 3.7 Đánh giá kết quả thực nghiệm 57 Kết luận 58 Tài liệu tham khảo 60 vi Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Cơ sở dữ liệu (CSDL) là một trong những lĩnh vực được tập trung nghiên cứu và phát triển của công nghệ thông tin, nhằm giải quyết các bài toán quản lý, tìm kiếm thông tin trong những hệ thống lớn đa dạng, phức tạp cho nhiều người sử dụng trên máy tính điện tử. Có thể nói E. F. Codd là người đầu tiên đề xuất mô hình dữ liệu quan hệ cho CSDL với công trình [6] mà ngày nay đã trở thành kinh điển. Đây là mô hình được xây dựng trên cơ sở lý thuyết toán học về các quan hệ, bao gồm các thực thể (đối tượng) và các mối quan hệ qua lại giữa chúng. Chỉ điều này đã tạo cơ sở toán học với cấu trúc hoàn chỉnh làm nền tảng cho các vấn đề nghiên cứu lý thuyết về CSDL. Người ta xem CSDL quan hệ như là một tập hợp hữu hạn các quan hệ. Trong đó mỗi quan hệ có thể được hình dung một cách trực quan như là một bảng chữ nhật gồm có các hàng và các cột. Mỗi hàng là một bản ghi (record) lưu trữ các dữ liệu. Mỗi cột là một thuộc tính. Trong lý thuyết thiết kế CSDL quan hệ, ràng buộc dữ liệu hay còn gọi là phụ thuộc dữ liệu có một ý nghĩa quan trọng trong việc đảm bảo tính nhất quán của dữ liệu. Nghiên cứu ràng buộc dữ liệu là một vấn đề cần thiết. Ý nghĩa của việc nêu ra khái niệm ràng buộc dữ liệu là nhằm đảm bảo cho dữ liệu trong CSDL không mâu thuẫn, phản ánh đúng thế giới hiện thực. Các nhà nghiên cứu đã đưa ra nhiều loại ràng buộc dữ liệu khác nhau để đáp ứng phù hợp với thực tế rất phong phú và đa dạng. Loại ràng buộc dữ liệu đầu tiên là phụ thuộc hàm được giới thiệu bởi E. F. Codd [6] vào những năm 1970. Ba loại ràng buộc dữ liệu khác sau đó cũng được xem xét đến là phụ thuộc đối ngẫu, phụ thuộc mạnh và phụ thuộc yếu bởiCzédli [7, 8] (1980). Tiếp sau đó J. Demetrovics và G.Gyepesi [11] (1983), vànhững người khác [1, 15, 26] vii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ cũng tiếp tục nghiên cứu các ràng buộc dữ liệu này. Với ba loại ràng buộc dữ liệu này, người sử dụng đôi khi có thể lấy được các thông tin thực mong muốn, ngay cả khi không tồn tại một phụ thuộc hàm nào giữa các tập thuộc tính và chỉ cần biết ít nhất một giá trị của các thuộc tính chứ không phải tập toàn bộ các giá trị của các thuộc tính của vế trái. Hơn thế nữa, đôi khi việc xử lý và tìm kiếm thông tin được tiến hành nhanh chóng hơn vì chỉ cần phải tìm kiếm trên một phần của quan hệ mà thôi. Mục tiêu của luận văn là tiếp tục nghiên cứu phụ thuộc hàm và phụ thuộc mạnh. Luận văn bao gồm: Phần mở đầu, 3 chương và phần kết luận. Chương 1: Nhắc lại một số khái niệm cơ bản về phụ thuộc hàm và quan hệ Armstrong. Chương 2: Mục đích của chương này là trình bày nghiên cứu quan hệ Armstrong đối với phụ thuộc mạnh. Có thể nói, trong nghiên cứu về các ràng buộc dữ liệu nói chung và phụ thuộc mạnh nói riêng, khái niệm bao đóng của tập thuộc tính thật sự đóng một vai trò quan trọng. Kết quả chính là trình bày một số nghiên cứu về quan hệ Armstrong. Đầu tiên, khái niệm họ các tập tối tiểu của thuộc tính của một sơ đồ mạnh được đề xuất. Đây là khái niệm đóng vai trò quan trọng trong việc xây dựng quan hệ Armstrong của sơ đồ mạnh Cuối cùng, luận văn đề cập đến bốn bài toán quan trọng đối với việc nghiên cứu cấu trúc và lôgic của họ phụ thuộc mạnh: bài toán xây dựng quan hệ Armstrong của một sơ đồ mạnh cho trước, bài toán xây dựng sơ đồ mạnh đúng trên một quan hệ cho trước, bài toán kéo theo phụ thuộc mạnh-quan hệ và bài toán tương đương phụ thuộc mạnh-quan hệ. Tất cả các bài toán này được chứng tỏ có thể được giải quyết bằng các thuật toán thời gian đa thức. Chương 3: Cài đặt chương trình để minh họa phụ lý thuyết phụ thuộc mạnh. viii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ BẢNG CÁC KÍ HIỆU Trong luận văn, có sử dụng các quy ước về kí hiệu và chữ viết tắt sau: S=(U,F): Sơ đồ quan hệ, với U là tập các thuộc tính và F là tập các phụ thuộc hàm trên U G=(U,S): Sơ đồ mạnh, với U là tập thuộc tính và S là tập các phụ thuộc mạnh trên U. R: quan hệ trên tập thuộc tính U. F R : (tương ứng S R ) tập tất cả các phụ thuộc hàm (tương ứng phụ thuộc mạnh) đúng trên quan hệ R. F + : (tương ứng S + ) bao đóng của tập phụ thuộc hàm (tương ứng phụ thuộc mạnh). K S : (tương ứng K G , K R ) tập tất cả các khóa tối tiểu của sơ đồ quan hệ s (tương ứng sơ đồ mạnh, quan hệ R). K S -1 : (tương ứng K R -1 ) tập phản khóa của K S (tương ứng K R ). K a : họ các tập tối tiểu của thuộc tính a. F n : (tương ứng D n ) tập tất cả các thuộc tính không cơ bản (tương ứng thuộc tính phụ thuộc). R : (tương ứng N R ) hệ bằng nhau (tương ứng không bằng nhau) quan hệ của R. I S : họ các tập độc lập tối tiểu của sơ đồ quan hệ s. L S : (tương ứng L R ) họ tất cả các bao đóng của tập thuộc tính của sơ đồ quan hệ s (tương ứng quan hệ R). CSDL: cơ sở dữ liệu. ix Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ BẢNG CÁC HÌNH VẼ Hình 1.1: Phụ thuộc hàm. Hình 1.2 : Tương quan giữa lớp quan hệ với lớp phụ thuộc hàm. Hình 1.3 : Tương quan giữa lớp phụ thuộc hàm với lớp hàm đóng. Hình 1.4 : Lớp các dạng chuẩn. Hình 1.5 : Tương quan giữa họ phụ thuộc hàm với hệ Sperner. Hình 1.6 : Tương quan lớp các hàm đóng với hàm chọn đặc biệt. Hình 1.7 : Tương quan giữa lớp các hàm đóng và nửa dàn giao. Hình 1.8 : Tương quan giữa lớp các nửa dàn giao và tập không giao. 1 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Chƣơng 1: PHỤ THUỘC HÀM Khái niệm phụ thuộc hàm được đề xuất bởi E.F.Codd và sau đó lần đầu tiên được tiên đề hoá bởi W.W.Armstrong [4](1974). Đây là một loại ràng buộc dữ liệu xảy ra tự nhiên nhất giữa các tập thuộc tính, về cơ bản các hệ quản trị cơ sở dữ liệu lớn đều sử dụng phụ thuộc này. 1.1 Định nghĩa Cho U là tập hữu hạn khác rỗng các thuộc tính. Một phụ thuộc hàm làmộtmệnh đề có dạng X Y, trong đóX, Y U. Ta nói phụ thuộc hàm X Y đúngtrong quan hệ R={h 1 , ,h m } trên U nếu: ( h i ,h j R)(( a X)(h i (a)=h j (a)) ( b Y)(h i (b)=h j (b))) Ta cũng nói rằng R thỏa phụ thuộc hàm X Y. Gọi F R là họ tất cả các phụ thuộc hàm đúng trên quan hệ R. Ta có thể nhận thấy rằng X mà phụ thuộc hàm vào Y, nếu hai dòng bất kỳ mà các giá trị của tập thuộc tính X mà bằng nhau từng cặp một, thì kéo theo các giá trị trên tập thuộc tính Y cũng phải bằng nhau từng cặp một. Với định nghĩa này dễ thấy rằng trong các file dữ liệu cột, mã số hoặc thứ tự không thể bằng nhau. [...]... phụ thuộc mạnh Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 20 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 21 Chƣơng 2: PHỤ THUỘC MẠNH VÀ MỘT SỐ TÍNH CHẤT ĐẶC TRƢNG CỦA PHỤ THUỘC MẠNH Phụ thuộc mạnh lần đầu tiên được giới thiệu và tiên đề hoá bởi G.Czédli trong [7,8] Sau đó được J.Demetrovics và G.Gyepesi tiếp tục nghiên cứu trong [10, 11] Phụ thuộc mạnh được cài đặt trong việc... đặc trưng của họ phụ thuộc mạnh 2.3 Bao đóng của tập phụ thuộc mạnh và tập thuộc tính Một sơ đồ mạnh G là một cặp (U,S), trong đóU là tập hữu hạn khác rỗng các thuộc tính và S là tập các phụ thuộc mạnh trên U Khi đó bao đóng của tập phụ thuộc mạnh S, ký hiệu S+, được định nghĩa là tập tất cả các phụ thuộc mạnh được dẫn xuất từ S bằng cách áp dụng các quy tắc từ (Sl)-(S5) J.Demetrovics trong [10] đã chứng... mảng dữ liệu lớn thành các mảng dữ liệu nhỏ hơn và đẹp để đưa vào bộ nhớ 2.1 Định nghĩa Cho U là một tập hữu hạn khác rỗng các thuộc tính Một phụ thuộc mạnh là một mệnh đề có dạng X Y, trong đó X,Y U Ta nói phụ thuộc mạnh Y đúng trong quan hệ R={hi, , hm} trên U nếu: ( hi, hj R)(( a X)(hi(a)=hj(a) ( b Y)(hi(b)=hj(b))) Ta cũng nói rằng R thoả phụ thuộc mạnh X Gọi SR là họ tất cả các phụ thuộc mạnh đứng... về phụ thuộc hàm trong đó tập trung về một số vấn đề sau: Hệ tiên đề Armstrong, bao đóng của tập phụ thuộc hàm và tập thuộc tính, khóa tối tiểu của sơ đồ quan hệ, các dạng chuẩn, hệ sperner và các dạng tương của họ phụ thuộc hàm Sang chương hai tập trung nghiên cứu và trình bày khái niệm phụ thuộc mạnh, một số tính chất đặc trưng của phụ thuộc mạnh và cuối cùng là một số bài toán đặc trưng của phụ thuộc. .. thể đặt cơ sở trên tập các ràng buộc dữ liệu không thay đổi Trong trường hợp các phụ thuộc hàm, điều đó đã được chỉ ra trong bài báo của E.F.Codd [6] Các lý do sau đây [1,11] được trình bày để chúng ta cố gắng chỉ ra ưu thế của việc sử dụng phụ thuộc mạnh ngoài phụ thuộc hàm Có thể xảy ra trường hợp người sử dụng chỉ biết ít nhất một giá trị thuộc tính chứ không phải tất cả các giá trị của tập thuộc. .. phụ thuộc hàm F nếu s ở dạng chuẩn một và mọi thuộc tính không cơ bản của s đều phụ thuộc đầy đủ vào mọi khoá tối tiểu của s 3 Ởdạng chuẩn ba(3NF) ứng với tập phụ thuộc hàm F nếu s ở dạng chuẩn một và không có thuộc tính không cơ bản của s phụ thuộc bắc cầu vào Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 10 bất kỳ một khoá tối tiểu của s 4 Ởdạng chuẩn Boyce-Codd(BCNF) ứng với tập phụ thuộc. .. với định nghĩa của phụ thuộc hàm chứng tỏ rằng hệ tiên đề Armstrong là đúng đắn và đầy đủ Có nghĩa là bốn tính chất (Fl)-(F4) đúng là các đặc trưng của họ phụ thuộc hàm Nhờ có hệ tiên đề này từ nay trở đi nghiên cứu và khảo sát họ phụ thuộc hàm không bị lệ thuộc vào các quan hệ (bảng) cụ thể Các công cụ của toán học được áp dụng để nghiên cứu làm sáng tỏ cấu trúc lôgic của mô hình dữ liệu quan hệ Đặc... G.Gottlob và L.Libkin [19]) Thuộc tính a được gọi là thuộc tính cơ bản của sơ đồ quan hệ s(tương ứng của quan hệ R) nếu tồn tại một khoá tối tiểu K Ks(tương ứng K KR) để a là một thuộc tính của K Trong trường hợp ngược lạia được gọi là thuộc tính không cơ bản Ký pháp Fn là tập tất cả các thuộc tính không cơ bản Thuộc tính cơ bản và thuộc tính không cơ bản đóng một vai trò quan trọng trong việc chuẩn hoá các... hình dữ liệu quan hệ của E.F.Codd Nhờ có chuẩn hoá, chúng ta tránh được dư thừa dữ liệu, dị thường trong cập nhật và tăng tốc độ của các phép toán xử lý quan hệ Cho F là tập phụ thuộc hàm trên U và X Y là một phụ thuộc hàm trong F Tập Y được gọi là phụ thuộc hàm đầy đủ vào X nếu X Y là rút gọn trái, nghĩa là không tồn tại một tập con thật sự Z của X sao cho Z Y F+ Ngược lại, Y được gọi là phụ thuộc. .. R Biết rằng, trong một cấu trúc dữ liệu thay đổi theo thời gian, tại một thời điểm nào đó có các ràng buộc dữ liệu Một số ràng buộc dữ liệu trong chúng có thể ngẫu nhiên hoặc không quan trọng, nhưng việc đòi hỏi ít nhất là Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 22 các ràng buộc dữ liệu nhất định là thoả mãn tại một thời điểm nào đó là hợp lý Việc tổ chức cấu trúc dữ liệu và một số . trình bày nghiên cứu quan hệ Armstrong đối với phụ thuộc mạnh. Có thể nói, trong nghiên cứu về các ràng buộc dữ liệu nói chung và phụ thuộc mạnh nói riêng, khái niệm bao đóng của tập thuộc tính. Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MẠNH HÀ NGHIÊN CỨU PHỤ THUỘC MẠNH TRONG CƠ SỞ DỮ LIỆU. (record) lưu trữ các dữ liệu. Mỗi cột là một thuộc tính. Trong lý thuyết thiết kế CSDL quan hệ, ràng buộc dữ liệu hay còn gọi là phụ thuộc dữ liệu có một ý nghĩa quan trọng trong việc đảm bảo

Ngày đăng: 23/11/2014, 00:21

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan