Cấp phát và cập nhật mảnh trong hệ phân tán

26 152 0
Cấp phát và cập nhật mảnh trong hệ phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN LƯƠNG VƯƠNG CẤP PHÁT VÀ CẬP NHẬT MẢNH TRONG HỆ PHÂN TÁN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Footer Page of 126 Header Page of 126 Công trình hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS LÊ VĂN SƠN Phản biện 1: PGS.TS VÕ TRUNG HÙNG Phản biện 2: GS.TS NGUYỄN THANH THỦY Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 18 tháng năm 2013 Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng - Trung tâm Học liệu, Đại Học Đà Nẵng Footer Page of 126 Header Page of 126 MỞ ĐẦU Tính cấp thiết đề tài Ngày nay, công nghệ thông tin (CNTT) trở thành nhân tố thiếu lĩnh vực đời sống xã hội Sự bùng nổ nhu cầu xây dựng hệ thống thông tin, mà trước hết hệ thống thông tin quản lý thu hút quan tâm nhiều nhà khoa học Các hệ thống sở liệu (CSDL) xuất Thập niên 60, xuất Mô hình liệu mạng (Network Data Model) Mô hình liệu phân cấp Mô hình liệu quan hệ (Relation Data Model) E.Codd đề xuất năm 1970 đánh dấu mốc phát triển quan trọng sở lý thuyết hệ thống CSDL Thập niên 80, thập niên hệ thống CSDL hướng đối tượng với phát triển rực rỡ vi xử lý đáp ứng yêu cầu tốc độ tính toán ngày cao Những máy tính có khả thực tới hàng tỷ phép tính giây nhờ công nghệ tích hợp chế tạo vi xử lý Song mặt vật lý mà nói, tích hợp vi mạch vào chip diện tích mà đến lúc khả tích hợp không nữa, nhà sản xuất sản xuất chip đa xử lý Vì chiến lược đặt theo hướng thứ hai chia toán thành công việc nhỏ để chạy song song hay nhiều xử lý Nghĩa tăng tốc độ tính toán cách sử dụng đồng thời nhiều máy tính để xử lý tính toán song song nhằm nâng cao hiệu tính toán, tiết kiệm thời gian, giảm chi phí, giải vấn đề lớn hơn, phức tạp tăng khả xử lý đồng thời cao Footer Page of 126 Header Page of 126 Lĩnh vực CNTT Việt nam non trẻ phát triển nhanh chóng góp phần không nhỏ công xây dựng, phát triển đất nước Nhiệm vụ cán làm công tác lĩnh vực CNTT phải trước, đón đầu tiến khoa học kỹ thuật xu hướng phát triển thời đại lĩnh vực CNTT Chính vậy, lựa chọn đề tài: “Cấp phát cập nhật mảnh hệ phân tán” để nghiên cứu thực Mục tiêu nghiên cứu Mục tiêu nghiên cứu - Nghiên cứu sở liệu phân tán - Nghiên cứu phương pháp thuật toán để phân mảnh, cập nhật cấp phát mảnh - Áp dụng để giải toán cập nhật cấp phát Nhiệm vụ đề tài - Nghiên cứu tổng quan sở liệu phân tán - Nghiên cứu phương pháp phân mảnh ngang nguyên thủy, phân mảnh dọc Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu bao gồm: - Lý thuyết sở liệu phân tán - Các vấn đề liên quan đến việc phân mảnh, tái cấu trúc kiểm tra tính đắn - Phương pháp phân mảnh ngang nguyên thủy phân mảnh dọc Phạm vi nghiên cứu: - Cơ sở liệu phân tán Bố cục đề tài Đề tài chia làm chương, cụ thể sau: Footer Page of 126 Header Page of 126 Chương : Hệ đa xử lý : Chương giới thiệu tổng quan hệ đa xử lý Chương : Cơ sở liệu – sở liệu phân tán : Chương đề cập đến việc thiết kế sở liệu phân tán khó khăn triển khai hệ sở liệu phân tán như: Tính phức tạp, chi phí, quyền điều khiển đề an toàn liệu Chương : Xây dựng chương trình thử nghiệm CHƯƠNG HỆ ĐA XỬ LÝ 1.1 TỔNG QUAN HỆ ĐA XỬ LÝ 1.1.1 Sơ đồ cấu trúc tổng quát hệ đa xử lý Tùy thuộc vào hệ khác nhau, vi xử lý có cấu trúc bên khác có số nguyên tắc hoạt động 1.1.2 Đa xử lý CMP (Chip multi processor) SIMD (Single Instrucstion stream, Multiple Data stream - Đơn thị đa liệu) Các máy tính loại SIMD gồm xử lý giống nhau, vi xử lý thực lệnh giống để xử lý nhiều dòng liệu khác Mỗi xử lý có nhớ liệu riêng, có chung nhớ lệnh xử lý điều khiển, nhớ đọc thi hành lệnh Tính song song máy SIMD tính song song liệu MIMD (Multiple Instruction Stream, Multiple Data Stream) Một hệ thống MIMD hệ thống nhiều xử lý nhiều nhớ, xử lý có đơn vị xử lý riêng thực chương trình riêng Các máy MIMD xử lý phân tán thông qua số xử lý độc lập, chia sẻ tài nguyên chứa hệ Footer Page of 126 Header Page of 126 thống nhớ chính, xử lý thực độc lập, đồng thời thực chương trình riêng Các hệ thống MIMD thực phép toán theo dạng song song không đồng bộ, nút hoạt động hợp tác chặt chẽ thực độc lập Ví dụ hệ thống phục vụ đặt chỗ máy bay, việc đặt chỗ xảy thường xuyên, liên tục đồng thời, đặt chỗ cần chương trình để thực hiện, chương trình không bắt đầu song song lệnh một, có nhiều dòng chảy lệnh nhiều dòng chảy liệu 1.2 ỨNG DỤNG ĐA XỬ LÝ DỮ LIỆU Database server: Database server dịch vụ kết nối trực tiếp đến máy chủ chứa sở liệu Server máy chủ mà có cài đặt phần HQTCSDL như: SQL Server, MySQL, Oracle… dịch vụ Database server hoàn toàn đạt hiệu hệ thống thiết kê có nhớ chia sẻ kiểu kiến trúc MIMD UMA Web server: Web server dịch vụ mà máy tính (máy chủ) cài đặt phần mềm phục vụ Web hay gọi Web Server Dịch vụ Web Server sử dụng hệ thống nhớ không chia sẻ MIMD NUMA Multimedia: Là kỹ thuật tích hợp thống dạng liệu khác với hỗ trợ máy tính CAD/CAM: CAD phần mềm thiết kế phần mềm vẽ có trợ giúp máy tính CAM hoạt động cụ thể công nghệ chế tạo khí Kết CAM cụ thể, chi tiết khí 1.3 NHỮNG VẤN ĐỀ CƠ BẢN VỀ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN DỰA TRÊN HỆ ĐA XỬ LÝ 1.3.1 Khái niệm sở liệu phân tán Footer Page of 126 Header Page of 126 Cơ sở liệu phân tán tập hợp liệu logic thuộc hệ thống trải rộng nhiều điểm mạng máy tính Như có hai vấn đề sở liệu phân tán với tầm quan trọng tương đương nhau: Việc phân tán: Trong thực tế liệu không đặt vị trí đặc điểm để phân biệt sở liệu phân tán với sở liệu tập trung sở liệu đơn lẻ Liên quan logic: Trong sở liệu phân tán, liệu có số đặc tính liên kết chặt chẽ với tính kết nối, tính liên quan logíc Trong sở liệu tập trung, vị trí quản lý sở liệu người sử dụng phải truy cập đến sở liệu vị trí khác để lấy thông tin tổng hợp 1.3.2 Lợi điểm sở liệu phân tán Có nhiều nguyên nhân để phát triển sở liệu phân tán lại gồm điểm sau đây: Lợi điểm tổ chức tính kinh tế Tận dụng sở liệu sẵn có Thuận lợi cho nhu cầu phát triển Giảm chi phí truyền thông Tăng số công việc thực Tính dễ hiểu sẵn sàng Hai nguyên nhân mặt kỹ thuật đáp ứng cho phát triển hệ sở liệu phân tán:  Công nghệ tạo máy tính nhỏ tảng phần cứng có khả phục vụ xây dựng hệ thống thông tin phân tán  Kỹ thuật thiết kế hệ sở liệu phân tán phát triển vững dựa hai kỹ thuật thiết kế Top-down Bottom-up từ năm thập kỷ 60 Footer Page of 126 Header Page of 126 Kỹ thuật thiết kế sở liệu phân tán phức tạp hệ sở liệu phân tán cần thiết cho xu hướng phát triển kinh tế 1.3.3 Hệ quản trị sở liệu phân tán Hệ quản trị sở liệu phân tán cung cấp công cụ tạo lập quản lý sở liệu phân tán Phân tích đặc điểm hệ thống quản trị sở liệu phân tán để phân biệt hệ thống phát triển theo kiểu thương mại có sẵn kiểu mẫu phân tán Những phần mềm cần thiết cho việc xây dựng sở liệu phân tán là:  Phần quản lý sở liệu ( Database Management - DB )  Phần truyền thông liệu (Data Communication - DC )  Từ điển liệu mở rộng để thể thông tin phân tán liệu mạng máy tính (Data Dictionary - DD)  Phần sở liệu phân tán (Distributed Database DDB) Mô hình thành phần hệ quản trị sở liệu phát triển theo kiểu thương mại (Truy cập từ xa trực tiếp) Cơ sở liệu địa phương Cơ sở liệu địa phương DB DC DDB DD DD DB DDB DC Hình 1.1 Mô hình truy cập từ xa trực tiếp Những dịch vụ hệ quản trị sở liệu cung cấp: Footer Page of 126 Header Page of 126  Cách thức truy cập liệu từ xa: chương trình ứng dụng  Lựa chọn cấp độ suốt phân tán thích hợp  Quản trị điều khiển sở liệu bao gồm công cụ quản lý sở liệu, tập hợp thông tin thao tác sở liệu cung cấp thông tin tổng thể file liệu đặt nơi hệ thống  Điều khiển tương tranh điều khiển hồi phục liệu giao tác phân tán Cách thức truy cập sở liệu từ xa qua chương trình ứng dụng theo hai cách bản: Truy cập từ xa trực tiếp gián tiếp 1.3.4 Các mức suốt sở liệu phân tán Trong hệ sở liệu phân tán, người thiết kế hệ thống xây dựng lên hệ phần mềm phục vụ yêu cầu người dùng sở liệu có sẵn Hình trình bày kiến trúc chung sở liệu phân tán Tất nhiên kiến trúc không biểu diễn tường minh cho hệ sở liệu phân tán Các mức sở liệu phân tán trình bày mang tính khái niệm thích hợp để dễ hiểu tổ chức sở liệu phân tán nói chung a Phân đoạn liệu cấp phát liệu Sự chia sẻ cho phép phân biệt hai mức khác mức độ suốt phân tán, có tên suốt phân đoạn suốt định vị b Điều khiển dư thừa Kiến trúc tham chiếu cho phép điều khiển dư thừa liệu mức đoạn Các đoạn có liệu giống dùng để kết nối liệu nguyên nhân dư thừa liệu c Độc lập với hệ quản trị cở sở liệu địa phương Footer Page of 126 Header Page 10 of 126 Đặc điểm gọi ánh xạ suốt sở liệu địa phương: quản trị sở liệu phân tán không cần quan tâm đến kiểu liệu xác định sở liệu địa phương 1.3.5 Quản trị sở liệu phân tán  Nội dung cách quản lý bảng danh mục Bảng danh mục chứa thông tin hệ thống cho chương trình ứng dụng có yêu cầu truy cập đến sở liệu Trong hệ thống phân tán, bảng danh mục chứa mô tả việc phân đoạn, cấp phát liệu ánh xạ tới tên sở liệu địa phương Như bảng danh mục trở thành sở liệu phân tán để phân tán vị trí quản lý cách hiệu  Mở rộng chế bảo vệ phân quyền hệ thống phân tán Vấn đề quan trọng quản trị sở liệu cấp độ tự trị vị trí tự trị địa phương Có hai cách giải cực đoan tính tự trị địa phương tự trị địa phương hoàn toàn a Quản lý bảng danh mục sở liệu phân tán b Nội dung bảng danh mục c Phân tán bảng danh mục d Quản trị bảo vệ e Áp đặt luật phân quyền f Phân lớp người sử dụng Trong sở liệu, phân lớp người sử dụng theo quyền cần cân nhắc công việc sau đây:  Sự xếp cách tự nhiên người sử dụng vấn đề việc phân tán sở liệu cho vị trí khác Giống người sử dụng vị trí x có Footer Page 10 of 126 Header Page 12 of 126 10 CHƯƠNG CƠ SỞ DỮ LIỆU PHÂN TÁN 2.1 CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN 2.1.1 Hệ quản trị cở sở liệu Về cơ sở liệu (Database) tập hợp liệu lưu trữ cách có tổ chức để phục vụ cho công việc sử dụng thuận tiện Dữ liệu số liệu, hình ảnh cần lưu trữ dạng file, record tiện lợi cho người dùng việc tham khảo, xử lý Mỗi sở liệu cần có chương trình quản lý, xắp xếp, trì liệu gọi hệ quản trị sở liệu (DBMS - Database Management System) Hệ quản trị sở liệu coi diễn dịch ngôn ngữ bậc cao để dịch công việc người sử dụng thao tác liệu mà người dùng không cần quan tâm đến thuật toán Về mặt kiến trúc, sở liệu phân chia thành mức khác Một sở liệu có ba phần mức vật lý, mức khái niệm mức thể Tuy nhiên với sở liệu cấp cao có nhiều mức phân hoá  Mức vật lý: mức thấp kiến trúc hệ sở liệu, mức liệu tổ chức nhiều cấp khác ghi, file  Mức khái niệm: biểu diễn trừu tượng sở liệu vật lý nói mức vật lý cài đặt cụ thể sở liệu mức khái niệm  Mức thể hiện: sở liệu thiết kế, thể (giao diện, chương trình quản lý, bảng ) gần gũi với người sử dụng với sở liệu mức khái niệm gọi Footer Page 12 of 126 Header Page 13 of 126 11 khung nhìn Như khác khung nhìn mức khái niệm không lớn 2.1.2 Kiến trúc hệ sở liệu phân tán + Hệ Client/Server + Hệ Peer-To-Peer 2.1.3 Thiết kế sở liệu phân tán a Cơ sở thiết kế sở liệu phân tán Thuật ngữ thiết kế sở liệu phân tán có nghĩa rộng không xác Thiết kế sở liệu tập trung gồm có công việc sau:  Thiết kế sơ đồ khái niệm: mô tả sở liệu hợp (mọi liệu sử dụng ứng dụng sở liệu)  Thiết kế sở liệu vật lý: tham chiếu từ lược đồ khái niệm tới vùng lưu trữ xác định cách thức truy cập khác  Trong sở liệu phân tán, có hai vấn đề xảy thiết kế sơ đồ toàn thiết kế sở liệu vật lý địa phương (ở vị trí) Những kỹ thuật ứng dụng cho hai vấn đề giống sở liệu phân tán Trong sở liệu phân tán bổ sung vào hai vấn đề nữa:  Thiết kế phân đoạn: xác định cách thức phân chia quan hệ toàn thành đoạn liệu theo chiều dọc ,chiều ngang kiểu hỗn hợp  Thiết kế cấp phát đoạn liệu: xác định cách thức đoạn liệu tham khảo đến ảnh vật lý xác định đoạn liệu  Đối tượng thiết kế sở liệu phân tán  Hướng thiết kế Top-dowwn Bottom-up sở liệu phân tán Footer Page 13 of 126 Header Page 14 of 126 12 b Thiết kế phân đoạn sở liệu  Phân đoạn ngang  Các phân đoạn ngang suy diễn  Phân đoạn dọc:  Phân đoạn hỗn hợp: c Cấp phát cho đoạn  Các chuẩn thông thường công việc cấp phát cho đoạn: Trong công việc cấp phát cho đoạn, quan trọng phân biệt thiết kế cấp phát cho đoạn dư thừa hay không dư thừa Để xác định cấp phát đoạn dư thừa phải dùng hai cách thức sau:  Xác định nhóm vị trí có lợi ích dụng cấp phát đoạn cấp phát đoạn cao chi phí cấp phát đoạn cho vị trí thành phần nhóm Cách có nghĩa lựa chọn vị trí có lợi  Đầu tiên xác định giải pháp toán cấp phát không lại đoạn sau tiếp tục lại bảo nơi có tính chất lợi ích Tiến trình kết thúc lợi  Đánh giá mức độ quan trọng giá trị lợi ích công việc cấp phát đoạn:  Sử dụng phương pháp thêm Ri cách phân đoạn lặp lại 2.2 CÁCH PHÂN MẢNH VÀ TÁI CẤU TRÚC CƠ SỞ DỮ LIỆU PHÂN TÁN Quan hệ EMP(ENO,ENAME,TITLE): Footer Page 14 of 126 13 Header Page 15 of 126 Trong EMP Employee, ENO Employee Number ( Mã số nhân viên), ENAME Employee Name (tên nhân viên), TITLE(Chức vụ) liệu định nghĩa sau: Bảng 2.1: Quan hệ EMP ENO ENAME TITLE E1 J.Doe Elect.Eng E2 M.Smith Syst.Anal E3 A.Lee Mech.Eng E4 J.Mmith Programmer E5 B.Casey Syst.Anal E6 L.Chu Elect.Eng E7 R.David Mech.Eng E8 J.Jones Syst.Anal Quan hệ PROJ(PNO,PNAME, BUDGET): Trong PNO Project Number (mã số dự án); PnameProject Name( Tên dự án) BUDGET (Ngân sách dự án), LOC(Location = vị trí) Và liệu giả định sau: Bảng 2.2: Quan hệ PROJ PNO PNAME BUDGET LOC P1 Intrumentation 150000 Montreal P2 Database 135000 New York P3 Develop 250000 New York P4 CAD/CAM Maintnance 310000 Paris Footer Page 15 of 126 14 Header Page 16 of 126 Quan hệ PAY(TITLE,SAL): Trong SAL – salary (Tiền lương) Và liệu giả định sau: Bảng 2.3: Quan hệ PAY TITLE SAL Elect.Eng 40000 Sys.Anal 34000 Mech.Eng 27000 Programer 24000 Quan hệ ASG (ENO,PNO,DUR,RESP) Trong ASG Assignment (Phân công nhiệm vụ): nhân viên làm dự án, thời gian làm, với nhiệm vụ, DUR (Duration=thời gian) RESP (Responsibility=nhiệm vụ) Và liệu giả định sau: Bảng 2.4: Quan hệ ASG ENO PNO E1 P1 Manager 12 E2 P1 Analyst 24 E2 P2 Analyst E3 P3 Consultant 10 E3 P4 Engineer 48 E4 P2 Programer 18 E5 P2 Manager 24 E6 P4 Manager 48 E7 P3 Engineer 36 E8 P3 Manager 40 Footer Page 16 of 126 RESP DUR Header Page 17 of 126 15 2.2.1 Tại cần phải phân mảnh 2.2.2 Phương pháp phân mảnh sở liệu phân tán Có hai phương pháp khác chia bảng theo chiều dọc chia bảng theo chiều ngang Chia dọc ta quan hệ mà quan hệ chứa tập thuộc tính (các cột) quan hệ gốc – gọi phân mảnh dọc Chia ngang quan hệ ta quan hệ mà quan hệ chứa số quan hệ gốc – gọi phân mảnh ngang Ngoài số khả hỗn hợp, phân mảnh kết hợp hai cách ngang dọc 2.2.3 Mức độ phân mảnh Phân mảnh CSDL đến mức độ định quan trọng có ảnh hưởng đến hiệu thực vấn tin Mức độ phân mảnh từ thái cực không phân thành mảnh đến thái cực phân mảnh thành (trường hợp phân mảnh ngang) thành thuộc tính (trường hợp phân mảnh dọc) 2.2.4 Quy tắc phân mảnh đắn Phải tuân thủ ba quy tắc phân mảnh mà chúng bảo đảm CSDL thay đổi ngữ nghĩa phân mảnh  Tính đầy đủ (completeness) Tính tái thiết (reconstruction)  Tính tách biệt (disjointness) 2.2.5 Các kiểu cấp phát Giả sử CSDL phân mảnh thích hợp cần phải định cấp phát mảnh cho vị trí mạng Khi liệu cấp phát, nhân trì nhất.Lý cần phải nhân nhằm đảm bảo tính tin cậy hiệu cho câu vấn tin đọc Footer Page 17 of 126 Header Page 18 of 126 16 2.2.6 Các yêu cầu thông tin Một điều cần lưu ý việc thiết kế phân tán nhiều yếu tố có ảnh hưởng đến thiết kế tối ưu Tổ chức logic CSDL, vị trí ứng dụng, đặc tính truy xuất ứng dụng đến CSDL, đặc tính hệ thống máy tính vị trí có ảnh hưởng đến định phân tán Điều khiến cho việc diễn đạt toán phân tán trở nên phức tạp 2.3 PHÂN MẢNH NGANG Có hai chiến lược phân mảnh ngang bản, :  Phân mảnh ngang nguyên thủy  Phân mảnh ngang dẫn xuất 2.3.1 Yêu cầu thông tin phân mảnh ngang a Thông tin sở liệu b Thông tin ứng dụng 2.3.2 Phân mảnh ngang nguyên thủy Phân mảnh ngang nguyên thủy định nghĩa phép toán chọn quan hệ chủ nhân lược đồ CSDL Vì cho biết quan hệ R, mảnh ngang R Ri Ri=R(Ei), 1 i  z Trong Ei công thức chọn (hội sơ cấp) sử dụng để có mảnh Ri Chú ý Ei có dạng chuẩn hội, vị từ hội sơ cấp (mi) Ri R thỏa mãn Ei 2.3.3 Phân mảnh ngang dẫn xuất Phân mảnh ngang dẫn xuất định nghĩa quan hệ thành viên đường nối dựa theo phép toán chọn quan hệ chủ nhân đường nối 2.3.4 Kiểm tra tính đắn phân mảnh ngang a Tính đầy đủ Footer Page 18 of 126 Header Page 19 of 126 17 Tính đầy đủ phân mảnh ngang nguyên thủy dựa vào vị từ chọn dùng Tính đầy đủ phân mảnh ngang dẫn xuất có khác chút Khó khăn vị từ định nghĩa phân mảnh có liên quan đến hai quan hệ b Tính tái thiết Tái thiết quan hệ toàn cục từ mảnh thực toán tử hợp phân mảnh ngang nguyên thủy lẫn dẫn xuất c Tính tách biệt Chúng ta dễ dàng thấy tính tách rời phân mảnh ngang nguyên thủy rõ ràng theo cách phân mảnh ta Với phân mảnh dẫn xuất, tính tách rời đảm bảo vị từ hội sơ cấp xác định phân mảnh có tính loại trừ lẫn (mutually excclusive) 2.4 PHÂN MẢNH DỌC 2.4.1 Phân mảnh dọc theo tụ lực a Tụ lực thuộc tính Giá trị sử dụng thuộc tính không đủ để làm sở cho việc tách phân mảnh Điều chúng không biểu thị cho độ lớn tần số ứng dụng Số đo lực hút (affinity) thuộc tính aff(Ai,Aj), biểu thị cho cầu nối (bond) hai thuộc tính quan hệ theo cách chúng ứng dụng truy xuất, đại lượng cần thiết cho toán phân mảnh b Thuật toán lượng nối BEA (Born Energy Algorithm) Thuật toán lượng nối BEA nhận nguyên liệu ma trận lực hút thuộc tính (AA), hoán vị hàng cột sinh ma trận lực tụ (CA) (clustered affinity matrix) Hoán vị thực Footer Page 19 of 126 Header Page 20 of 126 18 cho số đo lực hút chung AM (global affinity measure) lớn 2.4.2 Phân mảnh dọc có nối không thông tin a Khái niệm b Kiểm tra tính nối không 2.4.3 Phân mảnh dọc bảo toàn phụ thuộc a Định nghĩa b Kiểm tra tính bảo toàn phụ thuộc 2.4.4 Phân mảnh dọc có nối không thông tin bảo toàn phụ thuộc a Định nghĩa Cho lược đồ quan hệ R tập phụ thuộc hàm F Phép phân rã p=(R1,R2, ,Rk) có bảo toàn phụ thuộc có nối không mất, ta phải kiểm tra hai điều điện : + Tính bảo toàn phụ thuộc + Tính nối không b Kiểm tra phân rã dọc có nối không bảo toàn phụ thuộc 2.4.5 Phân mảnh dọc thành BCNF có nối không thông tin bảo toàn phụ thuộc a Phân rã dọc có nối không BCNF b Phân rã dọc thành BCNF có bảo toàn phụ thuộc c Phân rã dọc thành BCNF có bảo toàn phụ thuộc nối không 2.5 KẾT LUẬN Footer Page 20 of 126 19 Header Page 21 of 126 CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 VẤN ĐỀ CẬP NHẬT DỮ LIỆU PHÂN TÁN 3.1.1 Môi trường phân tán Cập nhật phân tán thực tế có nhiều người sử dụng chia sẻ truy nhập vào liệu tồn nhiều vị trí, nảy sinh điều cần quan tâm sau:  Sự (sự lan truyền cập nhật)  Điều khiển tương tranh  Việc quản lý khôi phục giao tác Trong hệ thống phân tán, đối tượng liệu mô tả nhiều vị trí Chắc chắn cập nhật mô tả vị trí lan truyền tới toàn vị trí khác trách nhiệm chế Oracle a Điều khiển tương tranh b Quản lý giao tác phân tán c Máy chủ máy chủ CSDL d Các điều phối cục e Điều phối toàn cục f Vị trí điểm chuyển giao g Commit point Strength h Các số giao dịch hệ thống 3.1.2 Các giao tác phân tán Có ba trường hợp toàn phần giao tác phân tán đọc: Một giao tác phân tán đọc phần nếu:  Chỉ câu hỏi dưa nhiều nút Footer Page 21 of 126 Header Page 22 of 126 20  Các cập nhật không sửa đổi ghi  Các cập nhật rollback vi phạm ràng buộc toàn vẹn trigger being fired 3.1.3 Giới hạn số giao tác nút Tham số khởi tạo DISTRIBUTED_TRANSACTION điều khiển số giao tác instance qui định kiêm vị trí tham gia, client server Nếu giới hạn đạt tới người sử dụng sau cố gắng đưa lệnh SQL tham khảo CSDL xa, lệnh rollback thông báo lỗi trả lại: ORA-2024: too many global transactions 3.1.4 Các vấn đề cập nhật phân tán Một mạng hệ thống lỗi dẫn đến vấn đề sau:  Chuẩn bị/Chuyển giao thực lỗi xẩy chưa hoàn thành toàn nút phiên  Nếu lỗi (ví dụ mạng hỏng thời gian dài), liệu dành riêng khoá giao tác nghi ngờ (in-doubt transaction) không sẵn sàng cho câu lệnh giao tác khác 3.1.5 Các lỗi cấm truy nhập liệu Khi người sử dụng đưa câu lệnh SQL, Oracle7 cố gắng khoá tài nguyên yêu cầu để thực thành công câu lệnh Tuy nhiên, liệu yêu cầu nắm giữ bới câu lệnh giao tác chưa chuyển giao khác tiếp tục khoá tổng số thời gian mức, hạn thời gian xảy 3.1.6 Overriding In-doubt Transaction Footer Page 22 of 126 21 Header Page 23 of 126 Một người quản trị CSDL hiệu lực thủ công chuyển giao rollback giao tác phân tán In-doubt Tuy nhiên, giao tác In-doubt xác định thủ công có hiệu lực cao tình sau tồn tại:  Giao tác in-doubt khoá liệu yêu cầu giao tác khác  Một giao tác in-doubt ngăn chặn khoảng rộng đoạn rollback sử dụng giao tác khác Phần đầu ID giao tác địa phương giao tác phân tán In-doubt giao tiếp với ID đoạn rollback, liệt kê view từ điển liệu DBA_2PC_PENDING DBA_ROLLBACK_SEGS  Lỗi không cho phép pha chuẩn bị chuyển giao hoàn thành không xác giai đoạn chấp nhận 3.2 CẤP PHÁT Cấp phát tài nguyên cho nút mạng mạng máy tính toán nhiều người quan tâm nghiên cứu rộng rãi Tuy nhiên, phần lớn nghiên cứu không tập trung vào toán thiết kế CSDL phân tán, mà vào cách thức cài đặt tập tin mạng máy tính 3.2.1 Bài toán cấp phát 3.2.2 Thông tin cho cấp phát Ở giai đoạn cấp phát, cần thông tin định lượng CSDL, ứng dụng chạy đó, cấu trúc mạng, khả xử lý giới hạn lưu trữ vị trí mạng Footer Page 23 of 126 Header Page 24 of 126 a Thông tin CSDL b Thông tin vị trí c Thông tin mạng 3.2.3 Mô hình cấp phát 3.3 KẾT LUẬN Footer Page 24 of 126 22 Header Page 25 of 126 23 KẾT LUẬN Hiện với việc phát triển vượt bậc công nghệ thông tin, chip xử lý liên tục phát triển đáp ứng việc tính toán ngày cao, giới hạn mặt vật lý nhà sản xuất tích hợp vi mạch vào chíp diện tích được, nhà sản xuất cho đời chíp đa xử lý Để tận dụng ưu điểm nhà lập trình hướng chia toán lớn thành toán nhỏ hơn, đơn giản để chạy song song hay nhiều vi xử lý Việc cấp phát cập nhật mảnh hệ thống phân tán, chia sẻ liệu thu thập liệu môi trường phân tán Internet/Intranet đòi hỏi phải tiếp tục nghiên cứu sâu thêm phương phán hành nhằm đáp ứng tính xác thực, hiệu hệ thống thông tin đăng ký mạng như: Việc đăng ký tua du lịch, mua bán giao dịch thương mại điện tử, đăng ký giữ chỗ giao thông vận tải, đăng ký dự thi hệ thống thông tin đào tạo, đăng ký sim thẻ, dịch vụ gia tăng nhà khai thác di động Luận văn nêu khái niệm tổng quát sở liệu phân tán, qua nhận thấy khác biệt sở liệu phân tán sở liệu tập trung, đồng thời lợi ích việc phát triển sở liệu công ty đặc biệt với công ty lớn có nhiều văn phòng, xí nghiệp khác mặt địa lý nhằm đáp ứng việc kiểm soát liệu địa phương theo hướng hoàn thiện tích hợp quản trị sở liệu từ xa tăng cường ứng dụng mà không cản trở người sử dụng tại, đáp ứng hầu hết việc sử dụng sở liệu nút Tại Chương II đề cập đến việc thiết kế sở liệu phân tán khó Footer Page 25 of 126 Header Page 26 of 126 24 khăn triển khai hệ sở liệu phân tán như: Tính phức tạp, chi phí, quyền điều khiển đề an toàn liệu Trọng tâm chương việc phân mảnh tái cấu trúc sở liệu đồng thời kiểm tra tính đắn sở diệu Do thời gian thực luận văn ngắn lên khả hoàn thành luận văn nhiều hạn chế, để hoàn thiện mặt thực nghiệm, ứng dụng triển khai cần phải quan tâm nhiều đến vấn đề cấp phát cập nhật mảnh cho hệ sở liệu phân tán tối ưu Footer Page 26 of 126 ... Cấp phát cập nhật mảnh hệ phân tán để nghiên cứu thực Mục tiêu nghiên cứu Mục tiêu nghiên cứu - Nghiên cứu sở liệu phân tán - Nghiên cứu phương pháp thuật toán để phân mảnh, cập nhật cấp phát. .. phân tán phức tạp hệ sở liệu phân tán cần thiết cho xu hướng phát triển kinh tế 1.3.3 Hệ quản trị sở liệu phân tán Hệ quản trị sở liệu phân tán cung cấp công cụ tạo lập quản lý sở liệu phân tán. .. quan hệ gốc – gọi phân mảnh dọc Chia ngang quan hệ ta quan hệ mà quan hệ chứa số quan hệ gốc – gọi phân mảnh ngang Ngoài số khả hỗn hợp, phân mảnh kết hợp hai cách ngang dọc 2.2.3 Mức độ phân mảnh

Ngày đăng: 01/05/2017, 21:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan