Nghiên cứu phụ thuộc hàm trên cơ sở siêu đồ thị và tập trù mật

60 578 4
Nghiên cứu phụ thuộc hàm trên cơ sở siêu đồ thị và tập trù mật

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG HÀ MỸ TRINH NGHIÊN CỨU PHỤ THUỘC HÀM TRÊN CƠ SỞ SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN – 2014 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 2 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG HÀ MỸ TRINH NGHIÊN CỨU PHỤ THUỘC HÀM TRÊN CƠ SỞ SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: GS.TS VŨ ĐỨC THI THÁI NGUYÊN – 2014 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 3 LỜI CAM ĐOAN Học viên xin cam đoan đây là công trình tổng hợp và nghiên cứu của riêng học viên. Các kết quả nêu trong luận văn là trung thực và rõ ràng đƣợc tìm hiểu trong cac tài liệu tham khảo. Xác nhận của giáo viên hƣớng dẫn GS.TS Vũ Đức Thi Học viên Hà Mỹ Trinh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 4 MỤC LỤC CHƢƠNG 1: KHÁI NIỆM CHUNG 10 1.1 Một số ký hiệu và quy ƣớc 10 1.2 Quan hệ và một số khái niệm cơ bản 13 1.2.1 Quan hệ 13 1.2.2 Cơ sở dữ liệu quan hệ 15 1.2.3 Đại số quan hệ 15 1.3 Phụ thuộc hàm 15 1.3.1 Định nghĩa 15 1.3.2 Hệ tiên đề Arsmtrong 16 1.3.3 Bao đóng của tập phụ thuộc hàm và tập thuộc tính 16 1.3.4 Khóa tối tiểu của sơ đồ quan hệ và quan hệ 19 1.3.5 Các dạng chuẩn 20 1.3.6. Hệ Sperner 22 1.3.7 Các dạng tƣơng đƣơng của họ phụ thuộc hàm 28 CHƢƠNG 2: MỘT SỐ THUẬT TOÁN SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT 30 2.1. Siêu đồ thị 30 2.1.1. Định nghĩa 30 2.1.2 Siêu đồ thị transversal 33 2.2 Tập độc lập 37 2.3 Tập trù mật 39 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 5 2.3.1. Tập trù mật của quan hệ 39 2.3.2. Tập trù mật của sơ đồ quan hệ 42 2.4 Khóa tối tiểu đối với phụ thuộc hàm 46 CHƢƠNG 3: ỨNG DỤNG TÌM KHÓA TỐI THIỂU TRONG MỘT FILE DỮ LIỆU 53 3.1 Mô tả bài toán 53 3.2 Cài đặt. 53 3.2.1 Yêu cầu hệ thống 53 3.2.2 Cấu trúc các lớp chƣơng trình 54 3.3Thử nghiệm chƣơng trình 54 KẾT LUẬN 57 TÀI LIỆU THAM KHẢO 58 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 6 DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT Trong suốt luận văn, học viên sử dụng các quy ƣớc về ký hiệu và chữ viết tắt sau: - s = (U,F): Sơ đồ quan hệ, với U là tập các thuộc tính và F là tập các phụ thuộc hàm. - R: Quan hệ trên tập thuộc tính. - F R : Tập tất cả các phụ thuộc hàm đúng trên quan hệ R. - F + : Bao đóng của tập phụ thuộc hàm. - :Tập tất cả các khóa tối tiểu của sơ đồ quan hệ s. - : Tập phản khóa . - F n : Tập tất cả các thuộc tính không cơ bản - D n : Tập tất cả các thuộc tính phụ thuộc. - : Hệ bằng nhau. - N R : Hệ không bằng nhau. - Trs(H): Họ tất cả các transversal của siêu đồ thị H. - Tr(H): Siêu đồ thị transversal của siêu đồ thị H. - I s : Họ các tập độc lập tối thiểu của sơ đồ quan hệ s. - L s : Họ tất cả các bao đóng của tập thuộc tính của sơ đồ quan hệ s. - CSDL: Cơ sở dữ liệu. - Relation scheme: Sơ đồ quan hệ. - Strong scheme: Sơ đồ mạnh. - Minimal key: Khóa tối tiểu. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 7 - Antikey: Phản khóa. - Minimum cover: Phủ tối tiểu. - Transversal hypergraph: Siêu đồ thị Transversal. - Dense families: Họ trù mật. - Simple hypergraph: Siêu đồ thị đơn. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 8 MỞ ĐẦU Cơ sở dữ liệu (CSDL) là một trong những lĩnh vực đƣợc tập trung nghiên cứu và phát triển của công nghệ thông tin, nhằm giải quyết các bài toán quản lý, tìm kiếm thông tin trong những hệ thống lớn đa dạng, phức tạp cho nhiều ngƣời sử dụng trên máy tính điện tử. Có thể nói E. F. Codd là ngƣời đầu tiên đề xuất mô hình dữ liệu quan hệ cho CSDL với công trình “A relational model for large shared data banks (1970)” và đã trở thành kinh điển. Đây là mô hình đƣợc xây dựng trên cơ sở lý thuyết toán học về các quan hệ, bao gồm các thực thể (đối tƣợng) và các mối quan hệ qua lại giữa chứng. Chính điều này đã tạo cơ sở toán học với cấu trúc hoàn chỉnh làm nền tảng cho các vấn đề nghiên cứu lý thuyết về CSDL. Ngƣời ta xem CSDL quan hệ nhƣ là một tập hợp hữu hạn các quan hệ. Trong đó mỗi quan hệ có thể đƣợc hình dung một cách trực quan nhƣ là một bảng chữ nhật gồm có các hàng và các cột. Mỗi hàng là một bản ghi (record) lƣu trữ các dữ liệu. Mỗi cột là một thuộc tính. Trong lý thuyết thiết kế CSDL quan hệ, ràng buộc dữ liệu hay còn gọi là phụ thuộc dữ liệu có một ý nghĩa quan trọng trong việc đảm bảo tính nhất quán của dữ liệu. Nghiên cứu ràng buộc dữ liệu là một vấn đề cần thiết. Ý nghĩa của việc nêu ra khái niệm ràng buộc dữ liệu là nhằm đảm bảo cho các dữ liệu trong CSDL không mâu thuẫn, phản ánh đúng thế giới hiện thực. Các nhà nghiên cứu đã đƣa ra nhiều loại ràng buộc dữ liệu khác nhau để đáp ứng phù hợp với thực tế phong phú và đa dạng. Loại dữ liệu ràng buộc đầu tiên là phụ thuộc hàm đƣợc giới thiệu bởi E. F. Codd vào năm 1970. G. Czédli [10], [11] (1980)đã xem xét đến ba loại ràng buộc dữ liệu khác nhau là: phụ thuộc đối ngẫu , phụ thuộc mạnh và phụ thuộc yếu. Tiếp sau đó các tác giả J. Demetrovics và G. Gyepesi (1983), [1], [17] cũng tiếp tục nghiên cứu các ràng buộc dữ liệu này. Với ba loại ràng buộc dữ liệu này, ngƣời sử dụng đôi khi có thể lấy đƣợc các thông tin thực mong muốn, ngay cả khi không tồn tại một phụ thuộc hàm nào giữa các tập thuộc tính và chỉ cần biết ít nhất một giá trị của các thuộc tính, chứ không phải tập toàn bộ các giá trị của thuộc tính của vế trái. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 9 Hơn thế nữa, đôi khi việc xử lý và tìm kiếm thông tin đƣợc tiến hành nhanh chóng hơn vì chỉ cần phải tìm kiếm một phần của quan hệ mà thôi. Mục tiêu của luận văn là tiếp tục nghiên cứu về phụ thuộc hàm trên cơ sở siêu đồ thị và tập trù mật. Luận văn bao gồm 3 chƣơng: Chƣơng 1: Khái niệm chung: Nhắc lại một số khái niệm cơ bản nhất của toán học. Kế đến là một số khái niệm quan hệ và một số khái niệm cơ bản liên quan khác. Tập trung giới thiệu về phụ thuộc hàm. Chƣơng 2: Một số thuật toán siêu đồ thì và tập trù mật: Lý thuyết siêu đồ thị là một trong những lĩnh vực quan trọng của toán rời rạc có nhiều ứng dụng có ý nghĩa đối với nhiều lĩnh vực trong tin học. Một siêu đồ thị Hchính là mở rộng của một đồ thị trên một tập hữu hạn các đỉnh U, với mỗi siêu cạnh H i của H là một tập con khác rỗng của U. Ngƣời ta đã chứng minh rằng lý thuyết siêu đồ thị đƣợc xem nhƣ là một công cụ thích hợp để giải quyết các bài toán tổ hợp trong mô hình dữ liệu quan hệ. Đặc biệt là khóa tối tiểu và phụ thuộc hàm. Luận văn nghiên cứu và tìm hiểu một số tính chất cũng nhƣ ứng dụng của họ trù mật. Phát biểu và chứng minh một điều kiện cần và đủ để một họ bất kỳ trù mật trong quan hệ Chƣơng 3: Luận văn nghiên cứu một số thuật toán tìm khóa tối tiểu trong một quan hệ dựa trên cơ sở siêu đồ thị và tập trù mật. Từ đó phát triển thành một chƣơng trình tìm khóa tối tiểu trong một file dữ liệu. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 10 CHƢƠNG 1: KHÁI NIỆM CHUNG Chƣơng này, đầu tiên nhắc lại một số khái niện của toán học cần thiết cho luận văn. Kế đến giới thiệu sơ lƣợc khái niệm quan hệ, cơ sở dữ liệu quan hệ và đại số quan hệ. Cuối cùng tập trung giới thiệu khái niệm phụ thuộc hàm. 1.1 Một số ký hiệu và quy ƣớc Những khái niệm và ký hiệu đƣợc trình bày trong đoạn sẽ đƣợc dùng xuyên suốt trong luận văn. Chúng ta sử dụng các chữ Latin hoa A, B, C, … , X, Y, Z để ký hiệu một tập hợp. Các chữ Latin thƣờng a, b, c, …, x, y, z để ký hiệu các phần tử của một tập hợp. Khi cần xác định thứ tự, các tập hợp (tƣơng ứng phần tử) sẽ đƣợc đánh chỉ số, chẳng hạn nhƣ A 1 , …, A n (tƣơng ứng a 1 , …, a n ). Họ (tập) các tập hợp chúng ta ký hiệu bằng các chữ Calligraphy A , B, C , …, X, Y, Z. Giả sử chúng ta cũng đã quen thuộc với các ký hiệu sau: thuộc (ϵ ), xây dựng tập ({ - |- }), tập rỗng ( ), tập hợp con ( ), tập hợp con thật sự ( ), hợp ( ), giao ( ), hiệu (-), n – bộ xắp thứ tự ((x 1 , …, x n )), tích Descartes (X 1 × … × X n ) lƣợng từ phổ dụng ( ) và lƣợng từ tồn tại ( ). Hợp của một họ các tập hợp S, ký hiệu S, đƣợc định nghĩa là Giao của một họ các tập hợp S, ký hiệu đƣợc định nghĩa là Đặc biệt ngƣời ta còn hay xét đến các tập hợp con của một tập hợp cố định U nào đó. Khi đó nếu X U thì U – X đƣợc gọi là phần bù của X đối với U. Trong trƣờng hợp này thay cho ký hiệu U – X ta viết là X, và U đƣợc gọi là tập hợp vũ trụ. Tập lũy thừa của U, ký hiệu P (U) đƣợc định nghĩa là tập hợp gồm tất cả các tập hợp con của U, tức là [...]... THUẬT TOÁN SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT Mục đích chính của chƣơng này là giới thiệu các công cụ dùng để nghiên cứu về tập phụ thuộc hàm, đó là siêu đồ thị và họ trù mật Những công cụ này đƣợc xem rất thích hợp để mô tả khóa, phụ thuộc hàm, các dạng chuẩn đối với phụ thuộc hàm, , trong lý thuyết CSDL quan hệ 2.1 Siêu đồ thị 2.1.1 Định nghĩa Cho U là một tập hợp hữu hạn khác rỗng và P(U) là tập lũy thừa... và không chứa tập (tƣơng ứng không chứa tập U và tập ) Vì siêu đồ thị đơn là một hệ Sperner, do đó có mệnh đề sau: Mệnh đề 2.1.2: Giả sử H là một siêu đồ thị đơn trên U = {a1, …, an} khi đó |H| Cho H là một siêu đồ thị trên U Họ Từ định nghĩa này nều bù của H nếu thì U } đƣợc gọi là siêu đồ thị ={ là siêu đồ thị bù của siêu đồ thị H H Mệnh đề 2.1.3: Giả sử H là một siêu đồ thị trên U và (1) H khi đó:... đƣợc gọi là tối tiểu nếu không có một tập con thật sự nào T‟ của T là transverstal Họ tất cả các transverstal tối tiểu của H đƣợc gọi là siêu đồ thị transverstal của H, và ký hiệu là Tr(H) Từ định nghĩa trên, siêu đồ thị transverstal Tr(H) của siêu đồ thị H trên tập U là một siêu đồ thị đơn trênU Ví dụ 2.1.6 Trong ví dụ 2.1.1, siêu đồ thị transverstal của siêu đồ thị H là Tr(H) = {{3}, {1, 2, 4}, {1,... http://www.lrc-tnu.edu.vn/ (2) H là siêu đồ thị đơn nếu và chỉ nếu là siêu đồ thị đơn Chứng minh: (1) Bởi định nghĩa siêu đồ thị bù, điều này rõ ràng (2) Vì U H nên rõ ràng là một siêu đồ thị trên U Giả sử siêu đồ thị đơn, tức là tồn tại hai cạnh E1, E2 Є không phải là sao cho E1 E2 Suy Do đó, theo (1) Hkhông phải là siêu đồ thị đơn Điều này trái ra với giả thiết Ngƣợc lại, giả sử H không phải là siêu đồ thị dơn, nghĩa... giả thiết và siêu đồ thị đơn Mệnh đề đƣợc chứng minh Định nghĩa 2.1.4 Giả sử H và G là hai siêu đồ thị trên U Ta nói rằng H ≥ G nếu với mỗi H tồn tại G H sao cho H G tồn tại G sao cho H G và ,và H ≤ G Nếu với mỗi Rõ ràng các quan hệ ≥ và ≤ là phản xạ, bắc cầu và xác định một thứ tự trên các siêu đồ thị đơn trên U Mệnh đề 2.1.5 Eiter T., Gottlob [21] (1991) Giả sử H và G là hai siêu đồ thị trên U Khi... một tập con thật sự Z của X sao cho Z → Y F+ Ngƣợc lại, Y đƣợc gọi là phụ thuộc bộ phận vào X U Tập Y đƣợc gọi là phụ Cho F là một tập phụ thuộc trên hàm U và X, Y thuộc bắc cầu vào X nếu tồn tại Z U sao cho X → Z F+, Z → Y F+, Z→ X F+ và Y Z, Ngƣợc lại, Y đƣợc gọi là phụ thuộc trực tiếp vào X Cho s = (U, F) là một sơ đồ quan hệ Khi đó s đƣợc gọi là: (1) Ở dạng chuẩn một (1NF) ứng với tập phụ thuộc hàm. .. = {Ei | Ei P(U), i = 1, 2, …, m} đƣợc gọi là một siêu đồ thị trên U nếu Ei ≠ với mọi i Các phần tử của U đƣợc gọi là các đỉnh và tập E1, …, Em là các siêu cạnh (để đơn giản gọi là cạnh) của siêu đồ thị H Nhƣ vậy, đồ thị chính là một siêu đồ thị với mỗi cạnh có lực lƣợng là hai Định nghĩa siêu đồ thị nhƣ trên có khác với một số định nghĩa về siêu đồ thị của một số tác giả khác Tuy nhiên, chúng lại thích... là các siêu đồ thị đơn Ngoài ra, min(H) và max(H) đƣợc xác định duy nhất bởi H Ví dụ 2.1.1 Cho U = {1, 2, 3, 4, 5} Rõ ràng H = {{1, 3}, {2, 3, 5}, {3,4}} là một siêu đồ thị trên U, và là một siêu đồ thị đơn Ta có min(H) = H và max(H) = H Trong luận văn này, luôn quy ƣớc rằng: Nếu siêu đồ thị đơn đóng vai trò là tập các khóa tối tiểu (tƣơng ứng tập phản khóa) thì siêu đồ thị đơn này không rỗng và không... toàn bộ miền giá trị của các thuộc tính trong quan hệ chỉ chứa giá trị nguyên tố (2) Ở dạng chuẩn hai (2NF) ứng với tập phụ thuộc hàm F nếu s ở dạng chuẩn một và mọi thuộc tính không cơ bản của s điều phụ thuộc đầy đủ vào mọi khóa tối tiểu của s (3) Ở dạng chuẩn ba (3NF) ứng với tập phụ thuộc hàm F nếu s ở dạng chuẩn một và không có thuộc tính nào của s phụ thuộc bắc cầu vào bất kỳ một khóa tối tiểu... quản trị cơ sở dữ liệu 1.3.3 Bao đóng của tập phụ thuộc hàm và tập thuộc tính Ta gọi sơ đồ quan hệ s là một cặp (U, F), trong đó U là tập hữu hạn khác rỗng các thuộc tính và F là tập các phụ thuộc hàm trên U Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16 http://www.lrc-tnu.edu.vn/ Nhƣ vậy, khi cho một sơ đồ quan hệ có nghĩa chúng ta cho một đầu biểu gồm nhiều cột, nhƣng không có dữ liệu và áp . CHƢƠNG 2: MỘT SỐ THUẬT TOÁN SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT 30 2.1. Siêu đồ thị 30 2.1.1. Định nghĩa 30 2.1.2 Siêu đồ thị transversal 33 2.2 Tập độc lập 37 2.3 Tập trù mật 39 Số hóa bởi Trung. THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG HÀ MỸ TRINH NGHIÊN CỨU PHỤ THUỘC HÀM TRÊN CƠ SỞ SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT Chuyên ngành: Khoa học máy tính Mã số:. THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG HÀ MỸ TRINH NGHIÊN CỨU PHỤ THUỘC HÀM TRÊN CƠ SỞ SIÊU ĐỒ THỊ VÀ TẬP TRÙ MẬT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Ngày đăng: 16/11/2014, 13:39

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan