Nghiên cứu một số khía cạnh lý thuyết trong mô hình CSDL quan hệ

131 655 0
Nghiên cứu một số khía cạnh lý thuyết trong mô hình CSDL quan hệ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ============== VŨ CHÍ QUANG NGHIÊN CỨU MỘT SỐ KHÍA CẠNH LÝ THUYẾT TRONG MƠ HÌNH CSDL QUAN HỆ LUẬN VĂN THẠC SĨ HÀ NỘI – 2007 MỤC LỤC MỞ ĐẦU Chƣơng I - LÝ THUYẾT THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ 1.1 Phƣơng pháp thiết kế Bottom – Up 1.1.1 Các khái niệm bản: 1.1.2 Các phép tốn mơ hình quan hệ 1.1.3 Phụ thuộc hàm 1.1.4 Lý thuyết chuẩn hoá 18 1.2 Phƣơng pháp thiết kế Top – Down 21 1.3 Quá trình thiết kế sở liệu 26 Chƣơng II - LÝ THUYẾT KẾT NỐI VÀ NỬA KẾT NỐI ỨNG DỤNG TRONG TỐI ƢU HOÁ CÂU HỎI 28 2.1 Lý thuyết kết nối số kết lý thuyết kết nối 28 2.1.1 Kết nối không thông tin 28 2.1.2 Kết nối thông tin 30 2.2 Một số tính chất, ý nghĩa nửa kết nối ứng dụng sở liệu phân tán 39 2.2.1 Giới thiệu phép nửa kết nối 39 2.2.2 Các tính chất phép nửa kết nối 41 2.2.3 ý nghĩa phép nửa kết nối ứng dụng CSDL phân tán 42 2.3 Tối ƣu hoá câu hỏi sở liệu phân tán 42 2.3.1 Khái quát sở liệu phân tán 42 2.3.2 Một số nguyên lý chung tối ƣu hoá câu hỏi 52 2.3.3 Tối ƣu hoá câu hỏi 71 Chƣơng III - MỘT SỐ BÀI TOÁN NP-C TRONG MƠ HÌNH QUAN HỆ 106 3.1 Tổng quan thuật toán đánh giá thuật toán 106 3.1.1 Khái niệm thuật toán 106 3.1.2 Các tính chất thuật tốn 107 3.1.3 Hai mơ hình tính tốn 108 3.1.4 Khái niệm độ phức tạp thuật toán 108 3.1.5 Phép quy dẫn (dẫn đƣợc) 110 3.1.6 Phân lớp toán theo độ phức tạp 111 3.1.7 Cấu trúc lớp P, NP 112 3.2 Một số tốn NP-C mơ hình quan hệ 114 3.2.1 Bài tốn siêu khố có lực lƣợng khơng q m 114 3.2.2 Bài toán định thuộc tính khố hay khơng khố 117 KẾT LUẬN 120 TÀI LIỆU THAM KHẢO 121 DANH MỤC CÁC HÌNH VẼ Hình 1.1 Bức tranh trật tự dạng chuẩn 18 Hình 1.2 Biểu đồ E-R cho CSDL công ty 24 Hình 1.3 Quá trình thiết kế sở liệu 27 Hình 2.1 Đồ thị biểu diễn lược đồ quan hệ R 31 Hình 2.2 Đồ thị bị cấm 34 Hình 2.3 Mơ quan hệ đỉnh 36 Hình 2.4: Kiến trúc lược đồ CSDL phân tán 46 Hình 2.5: Kiến trúc chức hệ QTCSDL phân tán 47 Hình 2.6: Các kiểu phân đoạn quan hệ 49 Hình 2.7 Lược đồ tổng quát xử lý truy vấn phân tán 59 Hình 2.8 Các đồ thị quan hệ 63 Hình 2.9 Đồ thị truy vấn khơng liên thông 63 Hình 2.10 Ví dụ truy vấn 64 Hình 2.11 Cây truy vấn tương đương 65 Hình 2.12 Cây truy vấn viết lại 66 Hình 2.13 Cây truy vấn sau thay 68 Hình 2.14 Rút gọn phân đoạn ngang (với phép chọn) 68 Hình 2.15 Rút gọn phân đoạn ngang (với phép nối) 69 Hình 2.16 Rút gọn phân đoạn dọc 70 Hình 2.17 Rút gọn phân đoạn hỗn hợp 71 Hình 2.18 Quá trình tối ưu hoá truy vấn 72 Hình 2.19 Các nối tương đương 73 Hình 2.20 Đồ thị nối truy vấn 84 Hình 2.21 Các thứ tự nối khác 84 Hình 2.22 Đồ thị nối truy vấn phân tán 86 Hình 2.23 Truy vấn mẫu số liệu thống kê 99 Hình 2.24 Đồ thị câu truy vấn đơn số liệu thống kê 102 Hình 3.1 Sơ đồ minh hoạ lớp toán NP, NP-C, NP-Hard 114 MỞ ĐẦU Trong lĩnh vực công nghệ thông tin, sở liệu chuyên ngành đông đảo người làm công nghệ thông tin quan tâm, nghiên cứu ứng dụng Ra đời từ năm 60 kỷ XX đến nay, hệ sở liệu ngày phát triển hoàn thiện, nhiều hệ quản trị CSDL đời, tạo nhiều sản phẩm ứng dụng khoa học kỹ thuật, ngành kinh tế đời sống xã hội Việc nghiên cứu CSDL giới nước phát triển ngày phong phú, đa dạng Từ năm 70, E.F Codd đưa mơ hình liệu quan hệ tạo sở vững cho vấn đề nghiên cứu CSDL Với ưu điểm tính cấu trúc khả hình thức hố phong phú, CSDL quan hệ dễ dàng mô hệ thống thông tin đa dạng thực tiễn, làm tăng khả xử lý, quản trị khai thác liệu, phục vụ hầu hết yêu cầu người sử dụng Trên thực tế, có nhiều hệ quản trị CSDL xây dựng mơ hình CSDL quan hệ sử dụng phổ biến thị trường như: DBASE, FOXPRO, ORACLE, MS SQL, Cho đến CSDL quan hệ thu nhiều thành tựu sâu sắc phương diện lý thuyết ứng dụng Phần lớn hệ quản trị CSDL sử dụng thực tiễn thiết kế mơ hình quan hệ, nhiều sản phẩm phần mềm tạo sử dụng rộng rãi có hiệu Việc tiếp tục nghiên cứu khía cạnh lý thuyết mơ hình CSDL quan hệ tạo điều kiện thuận lợi cho việc nghiên cứu phát triển mô hình sở liệu như: CSDL phân tán, CSDL suy diễn Hiện có nhiều vấn đề CSDL nghiên cứu giải Với mục đích tiếp tục nghiên cứu số khía cạnh lý thuyết mơ hình CSDL quan hệ để nâng cao khả ứng dụng hệ CSDL, luận văn tập trung nghiên cứu vấn đề: - Nghiên cứu sâu sắc lý thuyết kết nối nửa kết nối, ứng dụng lý thuyết kết nối nửa kết nối tối ưu hoá câu hỏi, đặc biệt tối ưu hoá câu hỏi phân tán - Nghiên cứu độ phức tạp thuật toán CSDL, giới thiệu số toán CSDL NP-C Nội dung luận văn chia làm chương: Chương 1: Lý thuyết thiết kế sở liệu quan hệ Chương trình bày phương pháp thiết kế sở liệu quan hệ, quy trình thiết kế vấn đề liên quan như: phép tốn mơ hình quan hệ, phụ thuộc hàm chuẩn hoá Chương II - Lý thuyết kết nối nửa kết nối Ứng dụng tối ưu hoá câu hỏi Đây chương luận văn; chương trình bày vấn đề lý thuyết kết nối như: kết nối không thông tin, kết nối thông tin, điều kiện cần đủ để kết nối không thông tin Phần trình bày phép nửa kết nối, tính chất ý nghĩa nửa kết nối ứng dụng sở liệu phân tán Phần cuối trình bày vấn đề ứng dụng lý thuyết kết nối nửa kết nối tối ưu hoá câu hỏi phân tán như: khái quát CSDL phân tán, vấn đề tối ưu hoá câu hỏi, thuật toán để tối ưu hoá câu hỏi môi trường tập trung môi trường phân tán Chương III - Một số tốn NP-C mơ hình quan hệ Chương trình bày khía cạnh lý thuyết sở liệu, đánh giá độ phức tạp thuật toán hệ sở liệu, vấn đề đề cập sách CSDL giới thiệu báo sách nghiên cứu sâu lý thuyết thuật toán độ phức tạp thuật tốn Ngồi chương cịn giới thiệu số tốn cụ thể sở liệu NP-C Mặc dù cố gắng để hoàn thành luận văn này, chắn cịn thiếu sót Rất mong góp ý thầy giáo bạn Chương I - LÝ THUYẾT THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ Trong lý thuyết thiết kế sở liệu quan hệ có hai cách tiếp cận, cách thứ thiết kế theo phương pháp Bottom – Up (dưới - lên), cách thứ hai thiết kế theo phương pháp Top – Down (trên – xuống) Theo phương pháp Bottom – Up: Mục đích việc thiết kế sở liệu quan hệ đưa tập lược đồ quan hệ để lưu trữ thơng tin tổ chức xí nghiệp, ngân hàng, đại học, cách không dư thừa đồng thời cho phép cập nhật, truy vấn dễ dàng Để đạt mục đích nghiên cứu khảo sát toán quản lý thực tiễn; ta phải xác định thuộc tính cần quản lý, mối quan hệ thuộc tính (các phụ thuộc hàm); chuẩn hoá lược đồ quan hệ, thực chất thực phép tách để có lược đồ theo dạng chuẩn (1NF, 2NF, 3NF, BCNF, 4NF, 5NF); nhiên phép tách phải đảm bảo điều kiện như: bảo tồn thuộc tính, bảo tồn phụ thuộc hàm, khơng mát thơng tin Theo phương pháp Top – Down: Khi nghiên cứu khảo sát toán quản lý thực tiễn; ta phải xác định đối tượng sở liệu mối liên hệ đối tượng; mơ hình hố thành kiểu thực thể, kiểu liên kết, xây dựng lược đồ thực thể liên kết ER; cuối áp dụng nguyên tắc chuyển từ mơ hình thực thể liên kết ER sang mơ hình quan hệ 1.1 Phương pháp thiết kế Bottom – Up 1.1.1 Các khái niệm bản: - Thuộc tính: Thuộc tính quan hệ cột bảng quan hệ Trong mơ hình quan hệ khơng cho phép thuộc tính phức hợp, đa trị Chỉ thuộc tính đơn, đơn trị - Miền giá trị: Là giới hạn liệu thuộc tính ký hiệu DOM(A) A thuộc tính Ví du: Với thuộc tính Lương miền giá trị là: – 1000000 - Lược đồ quan hệ: Mô tả cấu trúc quan hệ, ký hiệu R(A1, A2, , An) R tên quan hệ Ai (i=1 n) thuộc tính Ví dụ: Lược đồ quan hệ NHANVIEN( HOTEN, MSBHXH, DIACHI, LUONG, GIOITINH, NGAYSINH ) - Quan hệ: Là tập tích Descartes danh sách miền giá trị, ký hiệu là: r={t1, t2, , tm}  DOM(A1) x x DOM(An) Trong đó: + ti = + vij  DOM(Aj) (i=1 m; j=1 n) Chú ý: + Một quan hệ bảng hai chiều: + Số thuộc tính quan hệ số ngơi quan hệ + Thứ tự dịng, cột bảng quan hệ không quan trọng + Các giá trị bảng phải đơn trị phù hợp với kiểu liệu thuộc tính (ký tự, số, Logic, Ngày) + Dữ liệu quan hệ thay đổi theo thời gian thường xuyên phải cập nhật liệu + Quan hệ Nhân viên quan hệ - Lược đồ CSDL: Là tập lược đồ quan hệ ký hiệu là: S = {R1, R2, , Rm}, Ri (i=1 m) lược đồ quan hệ - CSDL Quan hệ: Là tập quan hệ ký hiệu là: DB = {r1, r2, , rm}, ri (i=1 m) quan hệ (thể Ri) - Siêu khoá (SK): SK gọi siêu khoá với t1, t2  r t1[SK]  t2[SK] Trong đó: + SK: nhiều cột (thuộc tính) bảng + t1, t2 giá trị hàng bảng + t1[SK], t2[SK] theo thứ tự giá trị SK tương ứng với t1, t2 - Khoá (K): Khoá lược đồ quan hệ siêu khố tối thiểu (khố dự tuyển) - Khố (PK): Là khố dự tuyển - Khố ngồi (FK): Một nhóm thuộc tính gọi khố ngồi (FK) quan hệ r1 tham chiếu đến quan hệ r2 miền giá trị FK r1 phải giống miền giá trị PK r2 - Ràng buộc: + Ràng buộc miền: vi  DOM(Ai) + Ràng buộc Khoá: Giá trị khoá phải + Ràng buộc tồn vẹn thực thể: Giá trị khố (PK) phải xác định (khơng có giá trị null) + Ràng buộc tồn tham chiếu:  Nếu Khố ngồi R1 tham chiếu đến khố R2 phải có miền giá trị với khố R2  Mỗi giá trị Khố ngồi R1 phải có mặt khố R2 nhận giá trị Null (với ngữ nghĩa giá trị tồn không biết) 1.1.2 Các phép tốn mơ hình quan hệ 1.1.2.1 Phép tốn cập nhật - Phép chèn (INSERT): Là phép thêm (bản ghi) vào quan hệ r - Phép loại bỏ (DELETE): Là phép loại bỏ khỏi quan hệ r - Phép cập nhật (UPDATE): Là phép thay đổi giá trị thuộc tính 1.1.2.2 Đại số quan hệ - Các phép toán tập hợp: Các quan hệ tham gia phép toán tập hợp (hợp, giao, trừ) phải có cấu trúc + Phép hợp r  s: Thực chất phép hợp xây dựng tập thuộc quan hệ r quan hệ s quan hệ Phép hợp ký hiệu định nghĩa là: r  s = { t  t  r t  s } + Phép giao r  s: Thực chất phép giao xây dựng tập thuộc quan hệ r s Phép giao ký hiệu định nghĩa là: r  s = { t  t  r t  s } + Phép trừ r \ s: Thực chất phép trừ xây dựng tập thuộc quan hệ r không thuộc quan hệ s Phép trừ ký hiệu định nghĩa là: r \ s = { t  t  r t  s } + Tích Descartes r x s: Tích Descartes hai quan hệ xét lược đồ rời (nếu hai lược đồ có thuộc tính tên ta đổi tên thuộc tính tên hai lược đồ, để hai lược đồ rời nhau) Cho hai lược đồ R={A1, A2, …, An} S={B1, B2, …, Bm}, r s hai quan hệ R S tương ứng Tích Descartes hai quan hệ r s quan hệ q Mỗi quan hệ q ký hiệu tq ghép tr r với ts s; tr = (a1, a2, …, an), ts = (b1, b2, …, bm), tq = (a1, a2, …, an, b1, b2, …, bm) Tích Descartes ký hiệu định nghĩa là: r x s = {tt=(a1, a2, , an, b1, b2, , bm), (a1, a2, , an)r (b1, b2, , bm)s} Như r có x bộ, s có y q có x * y + Phép chia r s: Cho lược đồ R ={A1, A2, …, An}, S  R, r s hai quan hệ R S tương ứng Phép chia quan hệ r cho s quan hệ q lược đồ R-S cho t  q ghép với u  s ta < t, u >  r Phép chia ký hiệu định nghĩa là: r  s = {t u  s , < t, u >  r } - Phép chiếu X(r): Thực chất phép chiếu loại bỏ số thuộc tính giữ lại thuộc tính cịn lại quan hệ (các thuộc tính tập X, X  R) Phép chiếu ký hiệu định nghĩa là: X(r) = {t[X]  t r } - Phép chọn (r): Thực chất phép chọn xây dựng tập quan hệ thoả mãn điều kiện xác định biểu thức logic; ta sử dụng phép tốn so sánh: =, >, >=, =,

Ngày đăng: 25/03/2015, 09:51

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH VẼ

  • MỞ ĐẦU

  • Chương I - LÝ THUYẾT THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ

  • 1.1. Phương pháp thiết kế Bottom – Up

  • 1.1.1. Các khái niệm cơ bản:

  • 1.1.2. Các phép toán trong mô hình quan hệ.

  • 1.1.3. Phụ thuộc hàm.

  • 1.1.4. Lý thuyết chuẩn hoá.

  • 1.2. Phương pháp thiết kế Top – Down

  • 1.3. Quá trình thiết kế cơ sở dữ liệu

  • 2.1 Lý thuyết kết nối và một số kết quả của lý thuyết kết nối.

  • 2.1.1 Kết nối không mất thông tin.

  • 2.1.2 Kết nối mất thông tin.

  • 2.2.1 Giới thiệu phép nửa kết nối.

  • 2.2.2 Các tính chất của phép nửa kết nối.

  • 2.2.3 Ý nghĩa của phép nửa kết nối ứng dụng trong CSDL phân tán

  • 2.3 Tối ƣu hoá câu hỏi trong cơ sở dữ liệu phân tán.

  • 2.3.1 Khái quát về cơ sở dữ liệu phân tán [2, 3, 9].

  • 2.3.2 Một số nguyên lý chung của tối ƣu hoá câu hỏi.

Tài liệu cùng người dùng

Tài liệu liên quan