Một số phụ thuộc dữ liệu trong cơ sở dữ liệu dạng khối

92 775 1
Một số phụ thuộc dữ liệu trong cơ sở dữ liệu dạng khối

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN TRỊNH ĐÌNH VINH MỘT SỐ PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU DẠNG KHỐI LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI - 2011 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN TRỊNH ĐÌNH VINH MỘT SỐ PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU DẠNG KHỐI Chuyên ngành: BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TOÁN Mã số: 62.46.35.01 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. GS.TS. Vũ Đức Thi 2. PGS.TS. Nguyễn Kim Anh HÀ NỘI – 2011 2 Lời cảm ơn để hoàn thành luận án này, tôi đã nhận đợc sự giúp đỡ rất tận tình của các thầy cô hớng dẫn khoa học, các thầy cô trong Viện CNTT và trờng ĐHSP Hà Nội 2. Tôi xin cảm ơn các thầy cô trong Viện CNTT và trờng ĐHSP Hà Nội 2 đã tạo điều kiện học tập, nghiên cứu, giúp đỡ tôi rất nhiều trong quá trình làm luận án. Đặc biệt tôi xin cảm ơn thầy GS. TS. Vũ Đức Thi, cô PGS.TS. Nguyễn Kim Anh đã tận tình hớng dẫn, chỉ bảo cho tôi trong toàn bộ quá trình học tập, nghiên cứu đề tài và giúp tôi hoàn thành bản luận án này. Trịnh Đình Vinh 3 Lời cam đoan Tôi xin cam đoan đây là công trình nghiên cứu của tôi dới sự hớng dẫn khoa học của các thầy cô GS.TS. Vũ Đức Thi và PGS. TS. Nguyễn Kim Anh. Các số liệu, kết quả nêu trong luận án là trung thực và cha từng đợc ai công bố trong bất kì công trình nào khác. Tác giả luận án Trịnh Đình Vinh 4 mục lục Trang Danh mục các ký hiệu và chữ viết tắt 7 Danh mục bảng biểu và hình vẽ .8 Lời mở đầu 9 Chơng 1: Mô hình cơ sở dữ liệu quan hệ 13 1.1. Các khái niệm cơ bản 13 1.1.1. Thuộc tính và miền thuộc tính 13 1.1.2. Quan hệ, lợc đồ quan hệ 13 1.1.3. Khoá của quan hệ 14 1.2. Các phép toán đại số quan hệ 15 1.2.1. Phép hợp .15 1.2.2. Phép giao .15 1.2.3. Phép trừ 16 1.2.4. Tích đề các 16 1.2.5. Phép chiếu 17 1.2.6. Phép chọn 17 1.2.7. Phép kết nối 18 1.2.8. Phép chia 20 1.3. Phụ thuộc hàm 20 1.3.1. Các tính chất của phụ thuộc hàm 21 1.3.2. Hệ tiên đề Armstrong và phép suy dẫn .21 1.4. Bao đóng 22 1.4.1. Bao đóng của tập phụ thuộc hàm 22 1.4.2. Bao đóng của tập thuộc tính 22 1.4.3. Bài toán thành viên và thuật toán tìm 5 bao đóng của tập thuộc tính 22 1.5. Khóa của lợc đồ quan hệ 24 1.6. Phủ của tập phụ thuộc hàm 26 1.7. Phủ tối thiểu của tập phụ thuộc hàm 26 1.7.1. Phụ thuộc hàm có vế trái d thừa 26 1.7.2. Tập phụ thuộc hàm có vế phải gồm 1 thuộc tính .27 1.7.3. Tập phụ thuộc hàm không d thừa .27 1.7.4. Tập phụ thuộc hàm tối thiểu 28 (Phủ tối thiểu của tập phụ thuộc hàm) 1.8. Các dạng chuẩn của lợc đồ quan hệ 28 1.9. Phụ thuộc đa trị 30 1.9.1. Định nghĩa phụ thuộc đa trị 30 1.9.2. Các tính chất của phụ thuộc đa trị 31 1.10. Kết luận chơng 1 32 Chơng 2 : Mô hình cơ sở dữ liệu dạng khối 33 2.1. Khối, lợc đồ khối 33 2.2. Lát cắt 34 2.3. Khoá của khối .35 2.4. Đại số quan hệ trên khối 37 2.4.1. Phép hợp 37 2.4.2. Phép giao .37 2.4.3. Phép trừ 37 2.4.4. Tích Đề Các 38 2.4.5. Tích Đề Các theo tập chỉ số .38 2.4.6. Phép chiếu 38 2.4.7. Phép chọn 39 2.4.8. Phép kết nối .39 6 2.4.9. Phép chia .40 2.5. Phụ thuộc hàm 41 2.6. Bao đóng của tập thuộc tính chỉ số 43 2.7. Khoá của lợc đồ khối R đối với tập các phụ thuộc hàm F trên R 45 2. 8. Dạng chuẩn của khối 46 2.9. Phủ của tập phụ thuộc hàm 48 2.10. Kết luận chơng 2 50 Chơng 3: phụ thuộc đa trị, phụ thuộc đa trị xấp xỉ và -phụ thuộc hàm trong mô hình dữ liệu dạng khối 51 3.1. Phụ thuộc đa trị trong mô hình dữ liệu dạng khối .51 3.2. Các tính chất của Phụ thuộc đa trị .53 3.3. Phụ thuộc đa trị xấp xỉ trong mô hình dữ liệu dạng khối 61 3.4. Các tính chất của phụ thuộc đa trị xấp xỉ 63 3.5. -Phụ thuộc hàm và -bao đóng trong mô hình dữ liệu dạng khối .71 3.5.1. Khái niệm xấp xỉ mức .71 3.5.2. -phụ thuộc hàm và -bao đóng 73 3.6. Kết luận chơng 3 .84 Phần kết luận 85 Danh mục công trình công bố của tác giả 87 Danh mục tài liệu tham khảo 88 7 danh mục các ký hiệu và các chữ viết tắt Trong luận án này dùng thống nhất các kí hiệu và các chữ viết tắt sau: Kí hiệu ý nghĩa A, B, C thuộc tính. X, Y, Z tập thuộc tính. XY XY (hợp của 2 tập thuộc tính X và Y). ABC [A, B, C] (tập thuộc tính gồm 3 phần tử A, B, C). Dom(A) miền giá trị của thuộc tính A. r hoặc r(R) khối r trên tập R. x (i) = (x, A i ) các thuộc tính chỉ số của lợc đồ khối (x id, i= 1 n). id (i) = {x (i) xid } tập các thuộc tính chỉ số của lợc đồ khối. r số phần tử của khối r. r' số phần tử của khối con r của khối r. 8 danh mục các bảng biểu và các hình vẽ Bảng biểu ý nghĩa Bảng 1.1 Biểu diễn quan hệ r 13 Bảng 1.2 Biểu diễn các quan hệ r, s và r x s16 Bảng 3.1 Quan hệ gần nhau trên miền giá trị của A 1 74 Hình vẽ ý nghĩa Hình 2.1 Biểu diễn khối nhân viên (NV(R)) 34 Hình 2.2 Biểu diễn khối Canbo 41 Hình 3.1 Biểu diễn khối Sinhviên1 52 Hình 3.2 Biểu diễn khối Sinhviên2 62 Hình 3.3 Biểu diễn khối Sinhviên3 74 9 Mở đầu Để xây dựng đợc một hệ thống cơ sở dữ liệu tốt, ngời ta thờng sử dụng các mô hình dữ liệu thích hợp. Mỗi mô hình dữ liệu là một hệ hình thức toán học gồm có hai phần: 1. Một hệ thống kí hiệu để mô tả dữ liệu. 2. Một tập hợp các phép toán thao tác trên dữ liệu đó. Từ trớc đến nay đã có một số loại mô hình đợc sử dụng trong các hệ thống cơ sở dữ liệu nh: mô hình thực thể - liên kết, mô hình mạng, mô hình phân cấp, mô hình hớng đối tợng, mô hình dữ liệu datalog và mô hình quan hệ. Trong số các mô hình này thì mô hình quan hệ là một trong những mô hình đợc nhiều nhà khoa học quan tâm nghiên cứu, khai thác ứng dụng vì nó đợc xây dựng trên một cơ sở toán học chặt chẽ [8], [15], [16], [20], [23], [25]. Tuy nhiên, do các quan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này sẽ rất khó khăn khi biểu diễn các dữ liệu có tính chất động (phi tuyến). Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình quan hệ đợc nhiều nhà khoa học quan tâm. Theo hớng nghiên cứu này đã có một số hớng mở rộng mô hình quan hệ đợc đề xuất nghiên cứu nh: mô hình dữ liệu đa chiều [2], [19], [26], [31]; khối dữ liệu [17], [27], [28], [33]; kho dữ liệu [22], [29], [32]; mô hình dữ liệu dạng khối [3], [4], [5], [6], [13], Trong đó chúng tôi thấy ở mô hình dữ liệu dạng khối, các khối là khái niệm cơ bản đợc mở rộng từ các quan hệ trong mô hình quan hệ, các khối này có thể biểu diễn các dữ liệu có tính chất động (biểu diễn các dữ liệu có thuộc tính thay đổi theo thời gian). Ví dụ: khi chúng ta dùng các quan hệ trong mô hình quan hệ để tạo cơ sở dữ liệu trong chơng trình quản lý lơng của các cán bộ trong một cơ quan thì mỗi khi cập nhật lơng mới cho cán bộ đợc tăng lơng nó sẽ làm mất dữ liệu lơng cũ trớc đó. Do đó, khi đến kỳ hạn xét tăng lơng cho các cán bộ [...]... tàu di chuyển vào bờ Tuy nhiên, trong mô hình khối này cũng còn nhiều loại phụ thuộc dữ liệu cha đợc nghiên cứu Vì vậy: Mục tiêu của luận án là nghiên cứu các phụ thuộc dữ liệu trong cơ sở dữ liệu, cụ thể là tập trung vào nghiên cứu các phụ thuộc dữ liệu trong mô hình dữ liệu dạng khối nhằm để góp phần bổ sung thêm vào lý thuyết thiết kế mô hình dữ liệu dạng khối Luận án bao gồm: Lời mở đầu, ba chơng... hàm trên lợc đồ khối; các tính chất về phủ, phủ tối thiểu của tập các phụ thuộc hàm; đa ra điều kiện cần và đủ của một phủ tối thiểu trong mô hình dạng khối [12] Chơng 3 trình bày khái niệm mới về phụ thuộc đa trị trong mô hình dữ liệu dạng khối; phát biểu và chứng minh các tính chất của phụ thuộc đa trị trong mô hình dữ liệu khối; đa ra tiêu chuẩn cần và đủ của một phụ thuộc đa trị trong mô hình này... trình bày trong chơng này là khái niệm phụ thuộc đa trị xấp xỉ mức k giữa các thuộc tính chỉ số của một khối trong mô hình dữ liệu dạng khối Trên cơ sở đó, các tính chất của phụ thuộc đa trị xấp xỉ, mối liên hệ giữa phụ thuộc đa trị xấp xỉ trên các lát cắt với các phụ thuộc đa trị xấp xỉ trên khối đã đợc phát biểu và chứng minh [10] Chơng này cũng trình bày thêm một khái niệm mới nữa về -phụ thuộc hàm;... liệu dạng khối đợc xây dựng và mô tả trong [3], [4], [5], [6], [13] Mô hình này phản ánh đợc các dữ liệu ở dạng động, giúp biểu diễn thế giới thực trong quá trình vận động một cách tự nhiên hơn ý nghĩa của các khái niệm phụ thuộc dữ liệu, khoá, các dạng chuẩn nh ở mô hình dữ liệu quan hệ 2.1 Khối, lợc đồ khối Khái niệm toán học làm nền tảng cho mô hình cơ sở dữ liệu dạng khối (gọi tắt là mô hình khối) ... là một bảng chữ nhật gồm có các hàng và các cột ở bảng này mỗi cột ứng với một thuộc tính, mỗi hàng đợc gọi là một bộ Do các quan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này sẽ rất khó khăn khi biểu diễn các dữ liệu có tính chất động (phi tuyến) 33 cHƯƠNG 2: MÔ HìNH CƠ Sở Dữ LIệU DạNG KHốI Để mở rộng mô hình quan hệ, chơng này đa ra một mô hình cơ sở dữ liệu khác gọi là mô hình cơ sở dữ liệu dạng. .. D} Phụ thuộc hàm ABD có A+=ABCD ADF+, nên trong F ta thay ABD bằng AD F {A BC, B C, A D} 1.7.2 Tập phụ thuộc hàm có vế phải một thuộc tính Mỗi tập phụ thuộc hàm F đều tơng đơng với một tập phụ thuộc hàm G mà vế phải của các phụ thuộc hàm trong G chỉ gồm một thuộc tính Ví dụ 1.15: Cho F = {A BC, B C, AB D} ta suy ra F {A B, A C , B C, AB D} = G G đợc gọi là tập phụ thuộc hàm có vế phải một. .. hàm có vế phải gồm một thuộc tính F là tập phụ thuộc hàm không d thừa Thuật toán 1.7 (tìm phủ tối thiểu của một tập phụ thuộc hàm) Vào: Tập phụ thuộc hàm F , lợc đồ quan hệ R xác định trên U Ra: Phủ tối thiểu của F Phơng pháp: Bớc 1: Loại khỏi F các phụ thuộc hàm có vế trái d thừa Bớc 2: Tách các phụ thuộc hàm có vế phải trên một thuộc tính thành các phụ thuộc hàm có vế phải gồm một thuộc tính Bớc 3:... và đó là phụ thuộc hàm, nhng đó không phải là duy nhất Trong thực tế còn nhiều loại phụ thuộc nữa Chẳng hạn: mỗi cặp vợ chồng (tên cha, tên mẹ) không phải là xác định duy nhất tên một đứa con mà là một hoặc một số con Mối quan hệ này trong cơ sở dữ liệu quan hệ gọi là phụ thuộc đa trị [1], [15], [16] 1.9.1 Định nghĩa phụ thuộc đa trị Cho lợc đồ quan hệ R(U) với U = {A1, A2, , An} là tập các thuộc tính... - A) Y} Ngợc lại Z Y là phụ thuộc hàm có vế trái không d thừa hay Y phụ thuộc hàm đầy đủ vào Z hay Z Y là phụ thuộc hàm đầy đủ Chú ý: phụ thuộc hàm có vế trái chứa một thuộc tính là phụ thuộc hàm đầy đủ Ví dụ 1.13: Cho tập phụ thuộc hàm F = {A BC, B C, AB D} thì phụ thuộc hàm ABD có vế trái d thừa B vì: F F {AB D}{A D} 27 {A BC, B C, A D} Ta nói F là tập phụ thuộc hàm có vế trái không... chứng minh các tính chất của nó trong mô hình dữ liệu dạng khối, điều kiện cần và đủ của -phụ thuộc hàm theo quan điểm tập thô cũng đợc phát biểu và chứng minh [9], [11] Ngoài ra ở chơng này còn phát biểu và chứng minh điều kiện cần và đủ của một -phụ thuộc hàm từ X vào Y khi mà X, Y có dạng riêng; xây dựng khái niệm mới về -bao đóng trong mô hình cơ sở dữ liệu dạng khối, chứng minh điều kiện cần và . và -phụ thuộc hàm trong mô hình dữ liệu dạng khối 51 3.1. Phụ thuộc đa trị trong mô hình dữ liệu dạng khối .51 3.2. Các tính chất của Phụ thuộc đa trị .53 3.3. Phụ thuộc đa trị xấp xỉ trong. tiêu của luận án là nghiên cứu các phụ thuộc dữ liệu trong cơ sở dữ liệu, cụ thể là tập trung vào nghiên cứu các phụ thuộc dữ liệu trong mô hình dữ liệu dạng khối nhằm để góp phần bổ sung thêm. mới về phụ thuộc đa trị trong mô hình dữ liệu dạng khối; phát biểu và chứng minh các tính chất của phụ thuộc đa trị trong mô hình dữ liệu khối; đa ra tiêu chuẩn cần và đủ của một phụ thuộc đa

Ngày đăng: 31/07/2014, 02:44

Từ khóa liên quan

Mục lục

  • Định lý 1.1

  • Thuật toán tìm bao đóng X+ là đúng.

  • Phụ thuộc hàm có vế trái dư thừa

  • 1.7.2. Tập phụ thuộc hàm có vế phải một thuộc tính

  • 1.7.3. Tập phụ thuộc hàm không dư thừa

  • 1.7.4. Tập phụ thuộc hàm tối thiểu (phủ tối thiểu của tập ph

  • Mệnh đề 2.8 [13]

    • Hệ quả

    • 3.5. -phụ thuộc hàm và -bao đóng trong mô hình dữ liệu dạn

      • Hệ quả

Tài liệu cùng người dùng

Tài liệu liên quan