CSDL phan tan ứng dụng quản lý sinh viên

47 3.1K 1
CSDL phan tan  ứng dụng quản lý sinh viên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

I. Sơ lược về CSDL và hệ phân tán 2 1. Sơ lược về CSDL 2 2. Sơ lược về hệ phân tán 3 II. Tổng quan về CSDL phân tán 6 1. Định nghĩa 6 2. So sánh CSDL tập trung và CSDL phân tán 7 3. Đặc điểm 9 4. Kiến trúc chung của CSDL phân tán 12 III. Thiết kế CSDL phân tán 17 1. Cơ sở thiết kế CSDL phân tán: 17 2. Đối tượng thiết kế của cơ sở dữ liệu phân tán 17 3. Các sản phẩm yêu cầu sau khi phân tích thiết kế 18 4. Các chiến lược phân tán dữ liệu 18 5. Phân mảnh dữ liệu 19 5.1 Các lý do phân mảnh 19 5.2 Các yêu cầu của phân mảnh 20 6. Hướng thiết kế trong CSDL phân tán 21 7. Xử lý truy vấn trong CSDL phân tán 23 7.1 Xử lý truy vấn trong môi trường tập trung 23 7.2 Định vị dữ liệu phân tánTối ưu hóa cục bộ 28 8. Tối ưu hóa truy vấn trong CSDL phân tán 34 8.1 Mô hình chi phí của bộ tối ưu hóa truy vấn 34 8.2 Các thống kê dữ liệu 36 8.3 Lực lượng của các kết quả trung gian 37 IV. Thiết kế CSDL phân tán cho hệ thống quản lý sinh viên theo mô hình phân tán …………………………………………………………………………39 1. Kiến trúc hệ CSDL phân tán của chương trình 39 2. Lược đồ quan niệm toàn cục 39 3. Phân mảnh dữ liệu 42 4. Các truy vấn phân tán 47 V. Lời cảm ơn 50

MỤC LỤC I Sơ lược CSDL hệ phân tán Sơ lược CSDL a Định nghĩa Cơ Sở Dữ Liệu –CSDL ( Data Base) CSDL hệ thống thông tin có cấu trúc lưu trữ thiết bị băng từ, đĩa từ,… để thỏa mãn yêu cầu khai thác đồng thời nhiều người sử dụng b Ưu điểm CSDL • Giảm trùng lặp thông tin xuống mức thấp đảm bảo tính quán toàn vẹn liệu • Đảm bảo liệu truy xuất theo nhiều cách khác • Khả chia sẻ thông tin cho nhiều người sử dụng c Đặc điểm CSDL • Tính chủ quyền liệu Tính chủ quyền liệu thể phương diện an toàn liệu, khả biểu diễn mối liên hệ ngữ nghĩa liệu tính xác liệu Điều có nghĩa người khai thác CSDL phải có nhiệm vụ cặp nhật thông tin CSDL • Tính bảo mật quyền khai thác thông tin người sử dụng Do có nhiều người phép khai thác liệu cách đồng thời, nên cần thiết phải có chế bảo mật phân quyền hạn khai thác CSDL Các hệ điều hành nhiều người sử dụng hay hệ điều hành mạng cục có cung cấp chế • Tranh chấp liệu Nhiều người phép truy nhập lúc vào tài nguyên liệu CSDL với mục đích khác nhau, cần thiết phải có chế ưu tiên truy nhập liệu Cơ chế ưu tiên thực việc cấp quyền ưu tiên cho người khai thác • Đảm bảo an toàn liệu có cố Việc quản lý liệu tập trung làm tăng khả mát sai lệch thông tin có cố điện đột xuất, hay phần đĩa lưu trữ CSDL bị hư,… số hệ điều hành mạng có cung cấp dịch vụ lưu ảnh đĩa cứng, tự động kiểm tra khắc phục lỗi có cố Tuy nhiên, bên cạnh dịch vụ hệ điều hành, để đảm bảo CSDL ổn định, CSDL thiết phải có chế khôi phục liệu có cố bất ngờ xảy Sơ lược hệ phân tán Mạng máy tính Một mạng máy tính tập máy tính tự vận hành, kết nối lại có khả trao đổi thông tin chúng Các máy tính mạng thương gọi nút hay trạm, chúng tạo phần cứng mạng kết nối lại với đường truyền Một mạng máy tính trường hợp đặc biệt môi trường xử lý phân tán, máy tính thiết bị kết nối vào kênh truyền liệu a Các loại mạng máy tính • Mạng hình sao: Thường dùng tổ chức có nhiều chi nhánh nhiều vùng khác có máy tính trung tâm đặt văn phòng trung tâm vùng Với loại mạng độ tin cậy thấp giao tiếp hai máy tính phụ thuộc vào máy tính trung tâm Tải trọng máy trung tâm lớn • Mạng vòng: Các máy tính mạng vòng nối với theo vòng khép kín Mỗi trạm đóng vai trò phận chuyển tiếp Trong vòng tròn liệu truyền theo chiều Đối với mạng đường nối bị đứt tai vị trí hệ thống dừng hoạt dộng lượng thông tin di chuyển đường truyền lớn • Mạng bus: Có kênh chung để truyền liệu, máy tính thiết bị đầu cuối gắn vào • Mạng hỗn hợp : Các mạng truyền thông thường có đường nối vô định Các đường nối tính hệ thống không tuân theo khuôn mẫu Các kết nối máy tính mạng internet thuộc loại • Mạng thảm: Là loại mạng mà nút kết nối với nút lại Có độ tin cậy cao khả hoạt động tốt cấu trúc khác song lại tốn chi phí xây dựng hệ thống b Các hình thức tổ chức hệ thống phân tán • Mô hình nhóm làm việc (peer-to-peer) • • Các máy tính cá nhân máy trạm sử dụng hệ thống độc lập trợ giúp ứng dụng địa phương Mỗi thành viên mạng có vai trò ngang tự quản lý tài nguyên chia sẻ tài nguyên cho máy tính khác mạng Mô hình phù hợp với hệ thống mạng nhỏ yêu cầu cao bảo mật Mô hình máy dịch vụ file ( File server) Là mô hình có số máy server gắn trực tiếp vào mạng LAN File Server thiết bị quản lý hoạt động file phục vụ máy tính cá nhân kết nối mạng LAN Mỗi máy tính cá nhân phân chia dung lượng cố định ổ cứng File Server, chương trình máy tính cá nhân tham chiếu đến file phần đĩa tương ứng đặc tả đường dẫn Tuy nhiên mô hình có số nhược điểm : liệu di chuyển mạng nhiều, việc kiểm soát đữ liệu phi tập trung máy chủ phải đủ mạnh Mô hình Client/Server( mô hình khách/chủ) Là mô hình có máy chủ gắn trực tiếp vào mạng LAN có chức điều khiển, lưu trữ CSDL, xử lý truy vấn quản lý khai thác tài nguyên mạng máy tính khác c I Các đặc trưng hệ thống phân tán kiến trúc client/server • Trình diễn thông tin phân tán Mục đích: làm ứng dụng máy khách để định dạng lại liệu server quản lý Server: quản lý phân tích liệu Sử dụng công nghệ trình diễn server để gửi liệu gửi cho clients Client: Dữ liệu trình diễn server định dạng để trình diễn cho clients • Trình diễn từ xa Mục đích: users muốn thay đổi biểu mẫu báo cáo nội dung cần bảo trì phần mềm máy khách Phần mềm client có khả trình diễn liệu định dạng theo ý client • Quản lý liệu từ xa Server quản lý liệu song việc phân tích liệu thô lấy từ server trình diễn liệu thực Client • Phân tán chức Các chức phân tán, đặt máy khách lẫn máy chủ Toàn chức trình diễn liệu đặt máy khách toàn chức quản lý liệu đặt máy chủ • Xử lý phân tán Cho phép phối hợp tốt đặc trưng hệ phân tán liên kết liệu chương trình máy chủ để lại chức trình diễn máy khách Cho phép định vị cách mềm dẻo chức phân tích xử lý liệu nơi mà chúng hoạt động tốt Tổng quan CSDL phân tán Định nghĩa  CSDL phân tán tập hợp liệu mặt logic tập hợp thuộc hệ thống, mặt vật lý liệu phân tán vị trí khác mạng máy tính  CSDL phân tán bao gồm tập trạm, trạm xem máy tính có thiết bị lưu trữ riêng Cũng có trạm có thiết bị lưu trữ nhỏ chí Các trạm liên kết cho thông báo liệu truyền qua lại trạm   CSDL phân tán không phụ thuộc vào vị trí địa lý trạm, ứng dụng mạng rộng hay mạng cục Như đơn vị liệu mặt vật lý chúng lưu trữ khác mặt logic điểm quan trọng • Phân tán Dữ liệu không cư trú vị trí mà phân bố rộng khắp nhiều máy tính đặt nhiều vị trí khác nhau, điểm phân biệt sở liệu phân tán với sở liệu tập trung • Tương quan logic Dữ liệu hệ phân tán có số thuộc tính ràng buộc chúng với Điều giúp phân biệt sở liệu phân tán với tập hợp sở liệu tập trung, file liệu lưu trữ nhiều vị trí khác nhau, điều thường thấy ứng dụng mà hệ thống phân quyền truy nhập liệu môi trường mạng So sánh CSDL tập trung CSDL phân tán CSDL phân tán không đơn giản thực phân tán CSDL tập trung, chúng cho phép thiết kế đặc trưng khác với CSDL tập trung truyền thống Các đặc điểm tiêu biểu CSDL truyền thống:     Điều khiển tập trung Độc lập liệu Giảm dư thừa Biệt lập bảo mật Điều khiển tập trung • CSDL tập trung: khả điều khiển tập trung toàn nguồn tài nguyên thông tin tổ chức, xem động mạnh cho việc đời CSDL Chúng phát triển hư tiến hóa hệ thống thông tin, mà ứng dụng có tập tin riêng • CSDL phân tán: ý niệm điều khiển tập trung nhấn mạnh Điều phụ thuộc vào kiến trúc CSDL phân tán CSDL phân tán điều khiển với cấu trúc phân lớp dựa vào hệ quản trị CSDL toàn cục (có trách nhiệm toàn CSDL phân tán) hệ quản trị CSDL địa phương ( có trách nhiệm với CSDL địa phương riêng) Điều cho thấy hệ quản trị CSDL địa phương có mức tự trị cao Các CSDL phân tán khác mức độ tự trị: từ hoàn toàn tự trị, hệ quản trị CSDL tập trung nào, đến hoàn toàn điều khiển tập trung Độc lập liệu: Thuận lợi độc lập liệu chương trình không bị ảnh hưởng thay đổi cấu trúc vật lý liệu Trong CSDL phân tán độc lập liệu quan trọng giống CSDL truyền thống Tuy nhiên, khía cạnh them vào ý niệm độc lập liệu suốt phân tán Với suốt phân tán hiểu chương trình ứng dụng sử dụng csld không tổ chức phân tán Vì xác chương trình không bị ảnh hưởng việc dịch chuyển liệu từ trạm đến trạm khác Giảm dư thừa liệu   Trong csld truyền thống: liệu dư thừa giảm đến mức tối thiểu hai lý do:  Sự không tương thích nhiều tập liệu  Tiết kiệm không gian lưu trữ cách loại bỏ dư thừa Việc giảm dư thừa liệu đạt cách chia liệu, cho phép nhiều ứng dụng truy cập tin ghi Trong CSDL phân tán: việc giảm dư thừa phức tạp hai lý nhiều lý để giảm dư thừa như:  Hoạt động trình ứng dụng bị tăng lên liệu lại tất vị trí, nơi trình ứng dụng cần Tính thường trực hệ thống tăng lên, có lỗi xảy trạm không dừng việc thực ứng dụng trạm khác liệu chép lại  Biệt lập bảo mật  Trong CSDL truyền thống: hệ quản trị CSDL tập trung đảm bảo truy cập đến liệu ủy quyền  Trong CSDL phân tán: hệ quản trị liệu địa phương thực chất phải đương đầu với vấn đề giống hệ quản trị CSDL CSDL truyền thống Tuy nhiên: CSDL phân tán với mức độ tự trị cao địa phương, người chủ liệu địa phương cảm giác bảo vệ tốt họ tự chủ thực bảo vệ thay phụ thuộc vào người quản trị CSDL trung tâm Vấn đề bảo mật chất hệ phân tán nói chung, mạng truyền thông diện rộng cho phép nhiều người cập nhật khai thác liệu nên cần bảo vệ Đặc điểm Ưu điểm:  Tăng độ tin cậy CSDL phân tán mong đợi tăng cường tính tin cậy có thành phần nhân làm giảm tác hại hỏng hóc điểm đơn lẻ mang lại hệ thống tập trung Sự hỏng hóc nút hay đường truyền thông làm hay số vị trí giao tiếp không mà làm ngừng hệ thống  Nâng cao hiệu Hiệu hệ CSDL phân tán nâng cao dựa hai điểm sau: o Một hệ CSDL phân tán phân mô hình quan niệm ( conceptual model ) thành mô hình quan niệm địa phương ( local conceptual model ), liệu lưu trữ vị trí gần với nhu cầu sử dụng Điều đem đến hai ưu điểm: o Mỗi vị trí phải quản lý phần liệu, CPU hoạt động tải CSDL tập trung  Giảm bớt thời gian truy nhập từ xa, thường gây chậm trễ, hỏng hóc o Thừa kế khả tính toán song song từ hệ phân tán, hệ CSDL phân tán cho phép thực thi nhiều query lúc hay phân chia query đơn thành nhiều query để thực nhiều nơi Điểm thứ giải nhược điểm tính toán phân tán: Dữ liệu chương trình xử lý lưu trữ nơi xa Nếu thực theo điểm thứ truyền tải khối lượng lớn liệu qua mạng Có số ý kiến cho rằng: Ngày nay, công nghệ mạng phát triển, đường truyền cao tốc, băng thông rộng cài đặt nhiều nơi Như vẫn trì chế cũ quên CSDL phân tán Tuy nhiên, tư tưởng lầm Trước tiên phải thấy rằng: Dữ liệu chất phân tán ép buộc đem chúng tập trung lại Thứ hai, họ không phân biệt băng thông – dung lượng đường truyền khoảng thời gian cần để truyền thông tin qua mạng Độ trễ truyền thông mạng giới hạn mặt vật lý, khó kiểm soát điều Ví dụ: Đường truyền vệ tinh cần nửa giây để truyền liệu hai trạm mặt đất Đây tính chất vật lý đường truyền mà cải thiện Điểm thứ hai quan trọng Trong trường hợp hệ CSDL phân tán sử dụng chế nhân Nhiều truy vấn read – only thực nhân thay tượng thắt cổ chai xảy mô hình tập trung trước o Dễ dàng mở rộng hệ thống Hoạt động môi trường phân tán, hệ CSDL phân tán nói dễ dàng đối phó với xu hướng mở rộng hệ CSDL hay thêm CSDL Điều thực việc thêm thành phần vật lý hay logic vào hệ thống Hơn nữa, liệu lưu trữ nhiều nơi, mà dung lượng nơi thường lớn Do đó, dung lượng hệ thống lớn  Đáp ứng nhanh hầu hết ứng dụng sử dụng liệu trạm       Tăng cường đơn thể ứng dụng CSDL mà không làm cản trở người sử dụng Kiểm soát liệu địa phương theo hướng hoàn thiện tích hợp quản trị liệu từ xa Tăng cường khả hệ thống liên quan đến dư thừa liệu Thuận lợi cho nhu cầu phát triển: Xu hướng dùng CSDL phân tán cung cấp khả phát triển thuận lợi giảm xung đột chức đơn vị tồn giảm xung đột chương trình ứng dụng truy cập đến CSDL Với hướng tập trung hóa nhu cầu phát triển tương lai gặp khó khăn Giảm chi phí truyền thông: Trong CSDL phân tán chương trình ứng dụng đặt địa phương giảm bớt chi phí truyền thông thực cách khai thác CSDL chỗ Nhược điểm    Các khó khăn phân tán liệu o Phân tán liệu qua site mạng đảm bảo tính tối ưu o Đảm bảo việc truy nhập xử lý site khác phải hiệu tối ưu o Chuyển đổi liệu tích hợp kết xử lý vị trí phải xác o Kiếm soát người dùng, chương trình ứng dụng truy cập vào site mã hóa thông tin, bảo mật đường truyền o Khôi phục liệu từ hỏng hóc thành phần phần cứng phần mềm phải an toàn hiệu o Đảm bảo quản lý giao dịch hiệu để giữ vững trạng thái quán cho CSDL Các khó khăn tích hợp liệu o Người dùng lập trình viên muốn tìm hiểu hệ CSDL tích hợp cần phải biết vị trí, định dạng liệu mà họ muốn truy cập o Khi muốn tạo truy vấn, kiểu cách, cấu trúc liệu site khác gây cản trở tạo truy vấn Các khó khăn khác • • • • Bài toán xác định truy vấn tối ưu khó Thường tìm chiến lược gần tối ưu tránh chiến lược tồi Đầu tối ưu lịch tình tối ưu bao gồm truy vấn đại số xác định mảnh phép toán truyền thông hỗ trợ việc thực truy vấn trạm Để chọn lựa chiến lược tối ưu ta phải xác định chi phí thực câu truy vấn thông qua tối ưu hóa truy vấn Chi phí thực tổ hợp có trọng số chi phí truyền thông, chi phí I/O chi phí CPU 8.1 Mô hình chi phí tối ưu hóa truy vấn • Chi phí chiến lược thực phân tán biểu diễn theo tổng chi phí theo thời gian trả lời • Tổng chi phí tổng tất thành phần chi phí: chi phí truyền thông, tri phí I/O chi phí CPU Tuy nhiên để đơn giản ta xet chi phí truyền thông chủ yếu coi tổng chi phí Công thức chung cho xác định tổng chi phí: Tổng chi phí: tæng cña tÊt c¶ c¸c chi phÝ CCPU, CI/O CMSG Total_cost= CCPU * #instr + CI/O * #I/OS + CMSG * #msgs + + CTR * #bytes Trong đó: Total_cost: tổng chi phí CCPU: chi phí lệnh CPU CI/O: chi phí xuất/nhập đĩa CMSG: chi phí việc khởi đầu nhận thông báo CTR: chi phí truyền đơn vị liệu từ trạm đến tram khác, ta xem CTR số #instr: tổng tất lệnh CPU trạm #I/OS: số lần xuất/nhập đĩa #msgs: số thông báo #bytes: tổng kích thước tất thông báo Hai thành phần chi phí đầu (CCPU,CI/O) chi phí địa phương Hai thành phần chi phí sau (CMSG, CTR) chi phí truyền thông Chi phí truyền thông để chuyển #byte liệu từ trạm đến trạm khác giả thiết hàm tuyến tính theo số #bytes truyền đi, xác định công thức CC(#byte)= CMSG + CTR * bytes • Thời gian trả lời truy vấn thời gian tính từ bắt đầu xử lý đến hoàn thành truy vấn Response_time = CCPU * seq_#instr + CI/O * seq_#I/OS + CMSG * seq_#msgs + CTR* seq_#bytes Trong đó: seq_#x (x số lệnh CPU, I/O, số thông bảo, số byte) số lớn x thực cách Trong đó: Response_time: thời gian trả lời truy vấn CCPU: chi phí lệnh CPU CI/O: chi phí xuất/nhập đĩa CMSG: chi phí việc khởi đầu nhận thông báo CTR: chi phí truyền đơn vị liệu từ trạm đến trạm khác #instr: tổng tất lệnh CPU trạm #I/OS: số lần xuất/nhập đĩa #msgs: số thông báo #bytes: tổng kích thước tất thông báo 8.2 Các thống kê liệu Kích thước quan hệ trung gian sinh trình thực yếu tổ ảnh hưởng đên hiệu suất hệ thống phép toán đặt trạm khác quan hệ trung gian phải truyền mạng Vì muốn có chi phí nhỏ thù phải tối thiểu hóa khỗi lượng liệu truyền Điều quan tâm đánh giá kích thước kết trung gian phép toán đại số quan hệ Đánh giá dựa cá thông tin thống kê quan hệ sở công thức ước tính lực lượng kết phép toán quan hệ Mục đích: Xác định kích thước quan hệ trung gian sinh tình thực câu truy vấn o Xác định chi phí truyền thông cho đại lượng trung gian 8.3 Lực lượng kết trung gian a Phép chọn card(σ (R)) = SFS(F) * card(R) Trong SFS(F) phụ thuộc vào công thức chọn tính sau, với p(Ai), p(Aj) tân từ tương ứng với thuộc tính Ai, Aj o Trong đó: card(π Ai(Rj): lực lượng phép chiếu mảnh R j lên thuộc tính Ai (số giá trị phân biệt thuộc tính Ai) max(Ai): giá trị cực đại thuộc tính Ai Dom(Ai) min(Ai): giá trị cực tiểu thuộc tính Ai Dom(Ai) card(Ri)): số mảnh Ri b c Phép chiếu Phép chiếu loại bỏ không loại bỏ sao, xét phép chiếu loại bỏ Nếu phép chiếu R thuộc tính đơn A lực lượng tính đơn giản số phép chiếu thực Nếu thuộc tính chiếu khóa R, card(πA(R)) = card(R) card(R×S) = card(R) * card(S) Phép nối Khó xác đinh lực lượng phép nối thông tin thêm Cận lực lượng phép nối lực lượng tích Decartes Tuy nhiên có số trường hợp xuất với đánh giá đơn giản: Nếu R⋈AB S với A∈R, B∈S, A khoá R, B khoá S, lực lượng kết xấp xỉ là: card(R⋈ AB S) = card(R) Với phép nối khác, lực lượng kết là: card(R⋈ S) = SFJ * card(R) * card(S) d e Phép nửa nối Hệ số chọn phép nửa nối (SFSJ) xấp xỉ là: Công thức phụ thuộc vào thuộc tính A S, nên thường gọi hệ số chọn thuộc tính A S, ký hiệu SF SJ(S.A) hệ số chọn S.A thuộc tính nối khác Vì thế, lực lượng phép nối tính sau: card(R⋈AS) = SFSJ(S.A) * card(R) Phép hợp Rất khó đánh giá số lượng R∪S, giống R S bị loại bỏ phép hợp Ở đưa công thức tính: cận card(R∪S) card(R)+card(S), • cận card(R∪S) max{card(R),card(S)} (giả sử R S không chứa lặp) Phép trừ Cũng phép hợp đưa cận cận dưới, cận card(R-S) card(R), cận • f III Thiết kế CSDL phân tán cho hệ thống quản lý sinh viên theo mô hình phân tán Kiến trúc hệ CSDL phân tán chương trình Do đơn vị hệ thống cần có DBMS riêng nên ta sử dụng mô hình kiến trúc đa hệ quản trị CSDL, hệ quản trị CSDL SQL server Trong đó, lược đồ quan niệm toàn cục lược đồ liên quan đến quản lý điểm sinh viên Lược đồ quan niệm toàn cục phân mảnh thành lược đồ địa phương đặt khoa, phòng đào tạo Kiến trúc biểu diễn sau: Ngoài ứng dụng toàn cục thực truy vấn lược đồ quan niệm toàn cục, ứng dụng địa phương truy vấn liệu địa phương Ngoài ra, địa phương truy vấn với nhau, đó, xây dựng thêm CSDL địa phương tích hợp vào hệ thống Lược đồ quan niệm toàn cục Do chương trình thực từ đầu nên trình thiết kế CSDL thực theo hướng top-down Quá trình triển khai từ xây dựng lược đồ quan niệm toàn cục hệ thống, sau tùy vào nhu cầu phân tán dùng chế phân tán cụ thể để phân tán lược đồ quan niệm toàn cục thành lược đồ liệu địa phương Các bảng CSDL gồm có: Bảng khoa Tên cột Ma_khoa Ten_khoa Thuộc tính varchar(10) nvarchar(50) Khóa yes Thuộc tính int varchar(10) nvarchar(50) Khóa yes Khóa ngoại Mô tả Mã khoa Tên khoa Bảng lớp Tên cột Ma_lop Ma_khoa Ten_lop Khóa ngoại yes Mô tả Mã lớp Mã khoa Tên lớp Bảng sinh viên Tên cột Ma_SV Ten_SV Ma_khoa Khoa_hoc Noi_sinh Ngay_sinh Thuộc tính varchar(10) nvarchar(50) varchar(10) varchar(5) nvarchar(100) datetime Khóa yes Khóa ngoại yes Mô tả Mã sinh viên Tên sinh viên Mã khoa Khóa Nơi sinh Ngày sinh Ten_bo Nghe_bo Ten_me Nghe_me Dia_chi nvarchar(50) nvarchar(50) nvarchar(50) nvarchar(50) nvarchar(100) Họ tên bố Nghề nghiệp bố Họ tên mẹ Nghề nghiệp Địa mẹ Bảng môn học Tên cột Ma_mh Ma_khoa Ten_mh So_trinh Thuộc tính int varchar(50) nvarchar(50) int Khóa yes Khóa ngoại yes Mô tả Mã môn học Mã khoa Tên môn học Đơn vị học trình Bảng sinh viên- lớp Tên cột Ma_SV Ma_khoa Ma_lop Thuộc tính varchar(10) varchar(10) int Khóa yes Khóa ngoại yes yes Mô tả Mã sinh viên Mã khoa Mã lớp Bảng lớp- môn học Tên cột Ma_lop Ma_mh Ma_khoa Hoc_ky Thuộc tính int int varchar(50) int Khóa Khóa yesngoại yes yes Mô tả Mã lớp Mã môn học Mã khoa học kì Mô hình lược đồ quan niệm toàn cục hệ thống là: Phân mảnh liệu Chúng ta thấy, phòng đào tạo có nhiệm vụ quản lý sinh viên, quản lý đào tạo, quy chế nên thông tin liên quan đến sinh viên, đào tạo… sử dụng nhiều phòng đào tạo, đặc biệt thao tác cập nhật thực tất khoa Do vậy, bảng khoa, lớp, môn học, mônlớp, sinh viên, sinh viên-lớp, quy chế lưu giữ toàn phòng đào tạo Như vậy, lược đồ quan niệm địa phương phòng đào tạo sau: Lược đồ quan niệm địa phương phòng đào tạo Tuy nhiên khoa cần có liệu khoa cần liệu khoa Vì giải pháp đay nhân liệu từ phòng đào tạo khoa Ở bảng để lưu trữ cột id_group (mã khoa) điều kiện lọc liệu nhân khoa Ta thực nhân theo hai phần Phần thứ nhất, bảng khoa, lớp, sinh viên, môn học phân công lớp-môn phòng đào tạo thực cập nhật, trình cập nhật thường diễn từ đầu năm học công tác cập nhật năm không diễn liên tục khoa đọc liệu từ bảng liệu bảng khoa cập nhật theo lô, bảng nhân khao theo chế nhân snapshot sql Server 2000 Chúng ta sử dụng trường id_gruop bảng làm điều kiện chọn lọc ngang phân liệu khoa khoa Dữ liệu bảng khoa đọc(read-only) Ghi chú: Snapshot chế nhân SQL Server 2000 thực chép toàn liệu phía nguồn (phòng đào tạo) chuyển cho phía đích (các khoa) theo thời điểm định kì, đòi hỏi phải kết nối mạng liên tục Phần thứ hai, bảng phân sinh viên-lớp thực cập nhật khoa ta sử dụng chế nhân merge (hòa trộn) SQL Server2000 Sử dụng chế gán mức ưu tiên Dữ liệu bảng sinh viênlớp cập nhật khoa có độ ưu tiên cao liệu cập nhật phòng đào tạo, trường hợp nảy sinh xung đột, liệu cập nhật khoa cập nhật thức trình nhân liệu Ghi chú: merge chế nhân SQL Server 2000 cho phép bên nguồn đích độc lập cập nhật liệu, cho liệu hòa trộn lại với Cơ chế nảy sinh tượng xung đột liệu làm tính quán Để giải quyết, gán độ ưu tiên cho liệu sử dụng bảng trung gian lưu trữ liệu xung đột trước cập nhật thực để người quản trị giải Sơ đồ nhân liệu Trong hệ thống mới, phòng đào tạo không chịu trách nhiệm quản lý điểm nữa, nhiệm vụ giao cho khoa (cụ thể văn phòng khoa) Như vậy, thao tác cập nhật thực chủ yếu khoa phòng đào tạo thực truy vấn liệu để xem xét Từ ta thực phân mảnh thứ hai áp dụng cho bảng điểm kì phân đoạn liệu Bảng điểm kì phân đoạn ngang, tiêu chuẩn phân đoạn sinh viên khoa bảng điểm khoa lưu trữ Sơ đồ phân đoạn ngang biểu diễn: Bảng điểm tạo khoa hợp thành từ khóa ngoại: mã sinh viên, mã môn học cột khác lần thi, điểm,… Chúng ta thấy kết hợp phần CSDL khoa, ta lược đồ quan niệm địa phương gồm tương đương lược đồ quan niệm toàn cục liệu chọn lọc, tập lược đồ quan niệm toàn cục ban đầu Đây đặc điểm phân mảnh liệu ngang Ngoài ra, hệ thống quản lý điểm cho phép sinh viên có khả tra cứu điểm thi mình, trước tiên qua mạng nội trường, sau mở rộng truy cập từ internet Lúc số lượng người truy cập tăng lên nhiều Nguy bị công từ người dùng vô danh cao Do đó, chương trình tiếp tục nhân bảng sinh viên, môn, điểm CSDL để phục vụ cho tra cứu điểm đối tượng nhân viên văn phòng Phần nhân thực sau: Bảng sinh viên nhân theo điều kiện chọn lọc dọc thành bảng gồm cột: mã sinh viên, tên sinh viên Bảng môn học nhân theo điều kiện chọn lọc dọc thành bảng gồm cột: mã môn học, tên môn học - Bảng điểm nhân toàn Toàn giải pháp phân mảnh liệu : Đánh giá: • Giải pháp phân mảnh thỏa mãn nguyên tắc đề để đảm bảo tính xác trình phân mảnh liệu gồm: tính hoàn toàn, tính tái tổ hợp, tính không trùng lặp • Giải pháp phân mảnh bảo toàn ràng buộc tham chiếu lược đồ quan niệm toàn cục lược đồ quan niệm địa phương, đó, đảm bảo tính toàn vẹn liệu • Giải pháp phân mảnh tính đến yếu tố: khối lượng truy vấn, an toàn cho CSDL… để đưa chi tiết phân mảnh phù hợp • Ngoài ra, tận dụng chế phục vụ cho phân tán liệu mà SQL Server 2000 cung cấp Các truy vấn phân tán Trong hệ thống quản lý điểm có truy vấn phân tán hai dạng lấy liệu cập nhật liệu Các truy vấn phát từ chương trình từ SQL Server khoa từ phòng đào tạo Các truy vấn phân tán xuất phát từ phòng đào tạo gồm có: truy vấn lấy liệu điểm từ khoa, truy vấn cập nhật liệu cho liệu nhân tới khoa Đối với truy vấn phân tán liệu điểm từ khoa, truy vấn thực nhờ chế liên kết server (linked server) SQL Server Ghi chú: liên kết server (linked server) chế SQL Server cung cấp để liên kết database server với hay nhiều database server khác nhằm mục đích trao đổi liệu server với Việc tạo kết nối thực qua hai bước: cung cấp tên server thông tin kết nối cung cấp thông tin đăng nhập đến server cần kết nối Đối với bảng liệu server B liên kết với server A server A truy vấn đến theo địa sau: [Tên server A].[tên CSDL].[dbo].[Tên bảng liệu] Như vậy, dựa vào linked server, câu truy vấn lấy liệu từ phòng đào tạo có dạng: Select [điểm] from [Tên server A].[Tên CSDL].[dbo].[tên bảng liệu] Khi cần lấy liệu điểm từ nhiều khoa, câu truy vấn có dạng Select [điểm] from [Tên server A].[Tên CSDL].[dbo].[tên bảng liệu] Union Select [điểm] from [Tên server B].[Tên CSDL].[dbo].[tên bảng liệu] Chương trình có tổ chức lưu trữ danh bạ toàn cục (Global Directory – GD) lưu trữ thông tin tên server, tên CSDL tương ứng phục vụ cho câu truy vấn phân tán lấy liệu điểm phòng đào tạo Mỗi cần truy vấn đến khoa đó, chương trình phòng đào tạo lấy thông tin tên server tên CSDL điểm tương ứng khoa để đưa vào câu truy vấn Hình 3.8: Truy vấn phân tán GD lưu trữ CSDL theo bảng sau: Tên cột Ten_khoa Ten_Server Ten_database Thuộc tính varchar(10) varchar(50) varchar(50) Khóa yes Khóa ngoại Mô tả Mã khoa Tên server Tên CSDL Đối với truy vấn phân tán cập nhật liệu cho CSDL nhân từ phòng đào tạo, truy vấn thực dịch vụ quản lý giao dịch phân tán MS DTC SLQ Server 2000 cung cấp Dịch vụ MS DTC thực giao thức chuyển giao hai pha để cập nhật liệu phân tán Mỗi có truy vấn cập nhật liệu từ phòng đào tạo, liệu trước hết cập nhật phòng đào tạo sau MS DTC cập nhật khoa Đối với truy vấn phân tán khoa, chủ yếu có truy vấn lấy liệu quy chế từ phòng đào tạo, chúng thực thông qua chế linked server trình bày [...]... ngang Môi trường của hệ CSDL phân tán II 1 Thiết kế CSDL phân tán Cơ sở thiết kế CSDL phân tán: Các công việc cần làm: Thiết kế sơ đồ khái niệm: mô tả CSDL đã hợp nhất Định vị các địa phương cần phân tán, loại hình phân tán sử dụng cho mỗi địa phương o Tiến hành cân đối các yếu tố được phân tán bao gồm các phần tử dữ liệ và các hoạt động xử lý trên mỗi trạm o Thiết kế CSDL vật lý: tham chiếu từ lược... trường hợp Thiết kế Bottom-up: thích hợp trong trường hợp CSDL phân tán được phát triển qua việc liên kết CSDL sẵn có Các CSDL này có thể dùng hệ quản trị CSDL địa phương ở vị trí đó Để hệ thống đồng bộ cần có thêm một số việc phức tạp như đồng bộ dữ liệu cần phải giải thích giữa các mẫu CSDL khác nhau Có thể tạo bản giải thích 1:1 giữa hai hệ quản tị CSDL địa phương Khi đó sơ đồ toàn thể được tạo ra bởi... các ảnh vật lý tại các trạm Các đoạn dữ liệu được đưa vào các vị trí lưu trữ thích hợp với yêu cầu hoạt động thực tế của hệ thống 4.Thiết kế cơ sở dữ liệu vật lý: thiết kế dữ liệu vật lý cho các quan hệ tại các trạm 7 a Xử lý truy vấn trong CSDL phân tán Mục đích của xử lý truy vấn: • Giảm thiểu thời gian xử lý Giảm vùng nhớ trung gian Giảm chi phí truyền tin giữa các trạm Chức năng của xử lý truy vấn:... được dữ liệu dư thừa Người lập trình ứng dụng có thể biết được dư thừa dữ liệu ở các trạm Ở hình vẽ trên ta thấy có sự trùng lặp dữ liệu ở trạm 3 giữa 2 ảnh vật lý R2 và R3 do đó có thể tránh được khi xấy dựng các khối ảnh vật lý • Độc lập với các DBMS địa phương Tính chất này còn được gọi là trong suốt ánh xạ địa phương cho phép chúng ta khảo sát các vấn đề về quản lý CSDL phân tán mà không cần phải hiểu... Hiện nay các DDBMSs thương mại đều tích hợp các ứng dụng phân tán nên rất tiện cho người sử dụng Kiến trúc chung của CSDL phân tán • Sơ đồ toàn thể: Mô tả mọi dữ liệu nằm trong CSDL phân tán như các dữ liệu không bị phân tán ở các trạm trong hệ thống Tuy nhiên mô hình sử dụng để xác đinh sơ đồ toàn thể để xác định cách thức ánh xạ đến những mức khác của CSDL phân tán Sơ đồ toàn thể xác định một tập các... và được đặt ở nhiều trạm trên mạng Nếu bản sao của CSDL được lưu giữ tại mọi trạm của hệ thống ta gọi là sao lặp đầy đủ Có thể tạo bản sao không đầy đủ phù hợp với yêu cầu dữ liệu ở mỗi trạm và một bản đầy đủ được quản lý ở server Sau một khoảng thời gian nhất định các bản sao được làm đồng bộ với bản chính bằng một ứng dụng nào đó Phương thức lai: CSDL được phân thành nhiều phần : quan trọng và không...o o o Phần mềm đắt và phức tạp Phải xử lý các thay đổi thông báo trong mọi địa điểm Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bộ phù hợp với việc sử dụng chung Đánh giá   4 Cơ sở dữ liệu phân tán là quan trọng trong kinh tế, tổ chức và kỹ thuật với nhiều lý do khác nhau Chúng có thể được cài đăt trên một mạng máy tính có... liệu tham khảo đến ảnh vật lý nào và cũng xác định các bản sao của đoạn dữ liệu Đối tượng thiết kế của cơ sở dữ liệu phân tán o o 2 Tiến trình địa phương: phân tán dữ liệu để cực đại hóa tiến trình địa phương hay tăng thời gian xử lý trung tâm cho tiến trình địa phương tương ứng với nguyên tắc là đơn giản hóa công việc : đặt dữ liệu gần chương trình ứng dụng thường xuyên sử dụng dữ liệu đó Thực hiện... liệu Phân đoạn dữ liệu: bao gồm những công việc mà người lập trình ứng dụng làm việc với quan hệ tổng thể , phân chia quan hệ tổng thể thành các đoạn Thông qua tính trong suốt phân đoạn người lập trình sẽ nhìn thấy được những đoạn dữ liệu bị phân chia như thế nào Định vị dữ liệu liên quan đến công việc của người sử dụng và lập trình ứng dụng tại trên các đoạn dữ liệu được định vị tại các trạm Thông qua... quan hệ 5.1 Các lý do phân mảnh Khung nhìn hoặc đơn vị truy xuất của các ứng dụng không phải là toàn bộ quan hệ mà thường là một mảnh Việc phân rã một quan hệ thành nhiều mảnh được xử lý như một đơn vị riêng rẽ, sẽ cho phép thực hiện nhiều giao dịch đồng thời Việc phân mảnh các quan hệ sẽ cho phép thực hiện song song một câu truy vấn bằng cách chia nó ra thành một tập các câu truy vấn con ứng với từng

Ngày đăng: 11/06/2016, 15:06

Từ khóa liên quan

Mục lục

  • 1. Sơ lược về CSDL

  • 2. Sơ lược về hệ phân tán

    • Mạng máy tính

    • I. Tổng quan về CSDL phân tán

      • 1. Định nghĩa

      • 2. So sánh CSDL tập trung và CSDL phân tán

      • 3. Đặc điểm

      • 4. Kiến trúc chung của CSDL phân tán

      • II. Thiết kế CSDL phân tán

        • 1. Cơ sở thiết kế CSDL phân tán:

        • 2. Đối tượng thiết kế của cơ sở dữ liệu phân tán

        • 3. Các sản phẩm yêu cầu sau khi phân tích thiết kế

        • 4. Các chiến lược phân tán dữ liệu

        • 5. Phân mảnh dữ liệu

          • 5.1 Các lý do phân mảnh

          • 5.2 Các yêu cầu của phân mảnh

          • 6. Hướng thiết kế trong CSDL phân tán

            • 6.1 Hướng thiết kế Top-down:

            • 7. Xử lý truy vấn trong CSDL phân tán

              • 7.1 Xử lý truy vấn trong môi trường tập trung

              • 7.2 Định vị dữ liệu phân tán-Tối ưu hóa cục bộ

              • 8. Tối ưu hóa truy vấn trong CSDL phân tán

                • 8.1 Mô hình chi phí của bộ tối ưu hóa truy vấn

                • 8.2 Các thống kê dữ liệu

                • 8.3 Lực lượng của các kết quả trung gian

                • III. Thiết kế CSDL phân tán cho hệ thống quản lý sinh viên theo mô hình phân tán

                  • 1. Kiến trúc hệ CSDL phân tán của chương trình

                  • 2. Lược đồ quan niệm toàn cục

Tài liệu cùng người dùng

Tài liệu liên quan