TÌM HIỂU VỀ PHÂN MẢNH NGANG TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

41 2.8K 3
TÌM HIỂU VỀ PHÂN MẢNH NGANG TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN PHÒNG ĐÀO TẠO SAU ĐẠI HỌC Bài thu hoạch môn học CƠ SỞ DỮ LIỆU NÂNG CAO Đề tài TÌM HIỂU VỀ PHÂN MẢNH NGANG TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN GIÁO VIÊN HƯỚNG DẪN: PGS.TS. ĐỖ PHÚC HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA LỚP: CAO HỌC CNTTQM KHÓA 6. MÃ SỐ HỌC VIÊN: CH1101016. TPHCM tháng 08/2012 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO LỜI NÓI ĐẦU Cơ sở dữ liệu phân tán là một khái niệm quan trọng trong thiết kế cơ sở dữ liệu hiện nay. Với ưu thế rất rõ ràng so với cơ sở dữ liệu tập trung, nhất là những lợi ích trong vấn đề tốc độ truy cập, tốc độ tìm kiếm và chi phí triển khai, duy trì, cơ sở dữ liệu phân tán là một chọn lựa tối ưu của các công ty lớn có cơ sỡ dữ liệu được lưu ở nhiều nơi. Trong thiết kế cơ sở dữ liệu phân tán thì phân mảnh là một biện pháp thường được chọn, trong đó phân mảnh ngang là một phương pháp hay được sử dụng. Trong khuôn khổ bài thu hoạch nhỏ này, tôi xin trình về những kiến thức về cơ sở dữ liệu phân tán nói chung, các cách thiết kế cơ sở dữ liệu phân tán, sau đó tôi sẽ triển khai chi tiết về kỹ thuật phân mảnh. Cuối cùng, tôi xin trình bày cụ thể về phân mảnh ngang, những yêu cầu, hướng thiết kế, ứng dụng và giải thuật cũng như cách đánh giá lại việc thiết kế dựa vào kỹ thuật phân mảnh ngang. Qua đây, tôi xin được gửi lời cảm ơn đến PGS – TS Đỗ Phúc, người đã tận tâm truyền đạt những kiến thức nền tảng cơ bản về môn học “Cơ sở dự liệu nâng cao”, để tôi có cơ sở kiến thức để có thể viết được bài thu hoạch này. Do kiến thức còn hạn hẹp, bài thu hoạch có thể có những sai sót nhất định, mong thầy và các bạn góp ý để bài thu hoạch ngày càng hoàn thiện hơn. Tôi xin tỏ lòng biết ơn sâu xa! Học viên thực hiện đề tài Nguyễn Văn Khoa HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 2 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO MỤC LỤC LỜI NÓI ĐẦU 2 MỤC LỤC 3 1. CƠ SỞ DỮ LIỆU PHÂN TÁN 4 Tìm hiều về cơ sở dữ liệu phân tán 4 Thiết kế cơ sở dữ liệu phân tán 12 Phân mảnh trong cơ sở dữ liệu phân toán 17 2. PHÂN MẢNH NGANG 24 Tìm hiểu về phân mảnh ngang 24 Yêu cầu thông tin trong phân mảnh ngang 24 Phân mảnh ngang nguyên thủy 28 Phân mảnh ngang dẫn xuất 35 Cách kiểm định tính đúng đắn của phân mảnh ngang 38 3. KẾT LUẬN 40 4. TÀI LIỆU THAM KHẢO 41 HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 3 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO 1. CƠ SỞ DỮ LIỆU PHÂN TÁN Tìm hiều về cơ sở dữ liệu phân tán Khái niệm Một CSDL phân tán (Distributed Database) là một tập hợp dữ liệu, mà về mặt logic tập hợp này thuộc cùng một hệ thống, nhưng về mặt vật lý dữ liệu đó được trải trên các vị trí khác nhau của một mạng máy tính. CSDL phân tán là một tập hợp nhiều CSDL có liên hệ logic và được phân bổ trên một mạng máy tính. Mỗi trạm của mạng có khả năng xử lý tự quản và có thể thực hiện các ứng dụng cục bộ, mỗi một trạm cũng có thể tham gia vào ít nhất 1 ứng dụng toàn cục, có yêu cầu truy xuất dữ liệu tại nhiều trạm. Có 2 điểm quan trọng nêu ra trong định nghĩa là phân tán và tương quan logic. Phân tán Dữ liệu không cư trú trên một vị trí mà được phân bố rộng khắp trên nhiều máy tính đặt tại nhiều vị trí khác nhau, đây là điểm phân biệt CSDL phân tán với CSDL tập trung. Tương quan logic: • Dữ liệu trong hệ phân tán có một số thuộc tính ràng buộc chúng với nhau. • Các file dữ liệu được lưu trữ tại nhiều vị trí khác nhau, điều này thường thấy trong các ứng dụng mà hệ thống sẽ phân quyền truy nhập dữ liệu trong môi trường mạng. Hệ thống mạng thông tin cho phép người dùng chia sẻ dữ liệu, vì vậy người dùng hoặc ứg dụng ở vị trí A đều có thể truy cập hay cập nhật dữ liệu tại vị trí B nào đó. • Các vị trí của một CSDL phân tán có thể trải rộng trên một khu vực lớn (toàn thế giới) hoặc một phạm vi hẹp (toà nhà) • Cũng như vậy, máy tính ở các vị trí phân tán có thể là bất cứ loại nào, từ máy vi tính đến các máy tính lớn Ví dụ Với một ngân hàng có ba chi nhánh đặt tại các vị trí khác nhau. Tại mỗi chi nhánh có một máy tính điều khiển một số máy tính khác và CSDL thống kê của HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 4 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO chi nhánh đó. Mỗi máy tính với CSDL thống kê của mỗi nhánh được đặt ở một vị trí của CSDL phân tán. Các máy tính được nối với nhau bởi một mạng truyền thông. Các nút trong một mạng phân tán một mặt xử lý thông tin tại vị trí mà nó quản lý, mặt khác nó cũng tham gia vào xử lý các yêu cầu về thông tin cần truy cập qua nhiều địa điểm. Ví dụ việc lên danh sách tất cả các nhân viên của công ty. Yêu cầu này đòi hỏi tất cả các máy tính ở các chi nhánh của công ty đều phải hoạt động để cung cấp thông tin. Đặc điểm Những đặc tính chính của cơ sở dữ liệu phân bán là chia sẻ tài nguyên, tính mở, khả năng song song, khả năng mở rộng, khả năng thứ lỗi, đảm bảo tính tin cậy và nhất quán và tính trong suốt. Chia sẻ tài nguyên • Được thực hiện qua mạng truyền thông. • Mỗi tài nguyên cần phải được quản lý bởi một chương trình có giao diện truyền thông • Các tài nguyên có thể được truy nhập, cập nhật một cách tin cậy và nhất quán. Quản lý tài nguyên bao gồm: • Lập kế hoạch dự phòng • Đặt tên cho các lớp tài nguyên • Cho phép tài nguyên được truy nhập từ nơi này đến nơi khác • Ánh xạ tên tài nguyên vào địa chỉ truyền thông. Tính mở Tính mở của hệ thống phân tán là tính dễ dàng mở rộng phần cứng của nó. Một hệ thống được gọi là có tính mở thì phải có các điều kiện sau: • Hệ thống có thể tạo nên bởi nhiều loại phần cứng và phần mềm của nhiều nhà cung cấp khác nhau. • Có thể bổ sung vào các dịch vụ dùng chung tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại. HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 5 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO • Tính mở được hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của một hệ và làm cho nó tương thích với các nhà phát triển phần mềm. • Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao diện dùng để truy nhập các tài nguyên chung. Khả năng song song • Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể có một hay nhiều CPU. • Có thể thực hiện nhiều tiến trình trong cùng một thời điểm. Việc thực hiện tiến trình theo cơ chế phân chia thời gian (một CPU) hay (nhiều CPU). • Khả năng làm việc song song trong hệ phân tán được thể hiện qua hai tình huống sau: • Nhiều người sử dụng đồng thời đưa ra các lệnh hay các tương tác với các chương trình ứng dụng. • Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình phải đáp ứng yêu cầu từ các Clients. Khả năng mở rộng Khả năng mở rộng của một hệ phân tán được đặc trưng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ được mở rộng. Yêu cầu cho việc mở rộng không chỉ là mở rộng phần cứng, về mạng mà nó trải trên các khía cạnh khi thiết kế hệ phân tán. Ví dụ: tần suất sử dụng trên mạng đột ngột. Để tránh tình trạng tắc nghẽn xảy ra khi chỉ có một Server và phải đáp ứng các yêu cầu truy nhập các file đó. Người ta nhân bản các file trên một Server khác và hệ thống được thiết kế sao cho việc thêm Server được dễ dàng. Một số giải pháp khác là sử dụng Cache và các bảng sao dữ liệu. Khả năng thứ lỗi Việc thiết kế khả năng thứ lỗi các hệ thống máy tính dựa trên hai giải pháp sau: • Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả. HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 6 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO • Dùng các chương trình hồi phục dữ liệu khi xảy ra sự cố. Đảm bảo tin cậy và nhất quán Hệ thống yêu cầu độ tin cậy như: • Bí mật của dữ liệu • Các chức năng khôi phục hư hỏng phải đảm bảo • Ngoài ra các yêu cầu của hệ thống về tính nhất quán cũng thể hiện ở chổ: không có mâu thuẩn trong nội dung cơ sở dữ liệu Tính trong suốt Tính trong suốt của một hệ phân tán được hiểu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng. Các loại trong suốt trong hệ phân tán: • Trong suốt phân đoạn (fragmentation transparency): Khi dữ liệu đã được phân đoạn thì việc truy cập vào CSDL được thực hiện bình thường như là chưa bị phân tán và không ảnh hưởng tới người sử dụng. • Trong suốt về vị trí (location transparency) o Người sử dụng không cần biết về vị trí vật lý của dữ liệu mà có quyền truy cập đến cơ sở dữ liệu tại bất cứ vị trí nào. o Các thao tác để lấy hoặc cập nhật một dữ liệu từ xa được tự động thực hiện bởi hệ thống tại điểm đưa ra yêu cầu. o Tính trong suốt về vị trí rất hữu ích, nó cho phép người sử dụng bỏ qua các bản sao dữ liệu đã tồn tại ở mỗi vị trí. Do đó có thể di chuyển một bản sao dữ liệu từ một vị trí này đến một vị trí khác và cho phép tạo các bản sao mới mà không ảnh hưởng đến các ứng dụng. So sánh với CSDL tập trung Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trưng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy được lợi ích của cơ sở dữ liệu phân tán. Đặc trưng mô tả cơ sở dữ liệu tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dư thừa, cơ cấu vật lý HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 7 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tương tranh, biệt lập và an toàn dữ liệu. Sau đây là vài so sánh giữa cơ sở dữ liệu phân tán và tập trung: Về điều khiển tập trung Điều khiển tập trung các nguồn thông tin của công việc hay tổ chức. Có người quản trị đảm bảo an toàn dữ liệu. Trong cơ sở dữ liệu phân tán, ta không đề cập đến vấn đề điều khiển tập trung. Người quản trị cơ sở dữ liệu chung phân quyền cho người quản trị cơ sở dữ liệu địa phương. Về độc lập dữ liệu Đây là một trong những nhân tố tác động đến cấu trúc cơ sở dữ liệu để tổ chức dữ liệu chuyển cho chương trình ứng dụng. Tiện lợi chính của độc lập dữ liệu là các chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống. Khái niệm cơ sở dữ liệu trong suốt mô tả hoạt động chương trình trên cơ sở dữ liệu phân tán được viết như làm việc trên cơ sở dữ liệu tập trung. Hay nói cách khác tính đúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy tính. Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thời gian di chuyển dữ liệu. Về giảm dư thừa dữ liệu Trong cơ sở dữ liệu tập trung, tính dư thừa hạn chế được càng nhiều càng tốt vì: • Dữ liệu không đồng nhất khi có vài bản sao của cùng cơ sở dữ liệu logic; để tránh được nhược điểm này giải pháp là chỉ có một bản sao duy nhất. • Giảm không gian lưu trữ. Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những nơi chương trình ứng dụng cần . Trong cơ sở dữ liệu truyền thống tính dư thừa dữ liệu cũng cần quan tâm vì: HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 8 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO • Tính cục bộ của chương trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi mà chương trình ứng dụng cần. • Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệ thống thì không cản trở hoạt động của chương trình ứng dụng. Nói chung, nguyên nhân đối lập với tính dư thừa đưa ra trong môi trường truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt của tính dư thừa đòi hỏi định giá lại công việc lựa chọn mức độ dư thừa dữ liệu. Cơ sở dữ liệu phân tán khắc phục được hai nhược điểm này vì dữ liệu được chia ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu. Về cấu trúc vật lý và khả năng truy cập Người sử dụng truy cập đến cơ sở dữ liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền Trong cơ sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến cơ sở dữ liệu. Hiệu quả có nghĩa là thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất. Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi người lập trình hoặc tạo ra bởi một bộ tối ưu. Công việc viết ra một cách thức truy cập cơ sở dữ liệu phân tán cũng giống như viết chương trình duyệt trong cơ sở dữ liệu tập trung. Công việc mà chương trình duyệt này làm là xác định xem có thể truy cập đến được bao nhiêu cơ sở dữ liệu. Về tính toàn vẹn, hồi phục và điều khiển tương tranh Mặc dù trong cơ sở dữ liệu, tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau. Mở rộng hơn vấn đề này là việc cung cấp các giao tác. Giao tác là đơn vị cơ bản của việc thực hiện: giao tác cụ thể là bó công việc được thực hiện toàn bộ hoặc không được thực hiện. Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 9 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO tiếp. Như vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong cơ sở dữ liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh. Về tính biệt lập và an toàn Trong cơ sở dữ liệu truyền thống, người quản trị hệ thống có quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào được dữ liệu. Điểm quan trọng là trong cách tiếp cận cơ sở dữ liệu tập trung, không cần thủ tục điều khiển chuyên biệt. Trong cơ sở dữ liệu phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống. Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến: • Thứ nhất trong cơ sở dữ liệu phân tán với cấp độ tự trị cao ở mỗi điểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung. • Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống như các hệ thống thông thường khác mà còn liên quan đến mạng truyền thông. Như vậy trong cơ sở dữ liệu phân tán vấn đề an toàn cơ sở dữ liệu phức tạp hơn và đòi hỏi nhiều kỹ thuật bảo vệ. Nguyên nhân gây ra là hệ thống này có tính mở và nhiều người dùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu. Lợi ích của cơ sở dữ liệu phân tán Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhưng tựu trung lại chỉ gồm những điểm sau đây: • Lợi điểm về tổ chức và tính kinh tế: tổ chức phân tán nhiều chi nhánh và dùng cơ sở dữ liệu phân tán phù hợp với các tổ chức kiểu này. Với vai trò là động lực thúc đẩy kinh tế thương mại phát triển rộng hơn, thì việc phát triển các trung tâm máy tính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết. • Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ các cơ sở dữ liệu tập trung có sẵn ở các vị trí địa phương. HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 10 [...]... cơ sở dữ liệu phân tán chương trình ứng dụng đặt ở địa phương có thể giảm bớt được chi phí truyền thông khi thực hiện bằng cách khai thác cơ sở dữ liệu tại chỗ • Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lượng công việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu. .. THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO Hình 6 Phân mảnh dọc Việc phân mảnh có thể lồng ghép, vừa phân mảnh ngang vừa phân mảnh dọc, thành phân mảnh hỗn hợp (hybrid fragmentation) Các qui tắc phân mảnh đúng đắn Có ba qui tắc trong khi phân mảnh đảm bảo CSDL sẽ không thay đổi ngữ nghĩa khi phân mảnh Tính đầy đủ (completeness): Cho quan hệ r bất kỳ Giả sử r được phân rã thành các mảnh Khi đó tính đầy... về mặt kỹ thuật đáp ứng cho sự phát triển hệ cơ sở dữ liệu phân tán: • Công nghệ tạo ra máy tính nhỏ và nền tảng phần cứng có khả năng phục vụ xây dựng hệ thống thông tin phân tán • Kỹ thuật thiết kế hệ cơ sở dữ liệu phân tán được phát triển vững chắc dựa trên hai kỹ thuật thiết kế chính là Top-down và Bottom-up từ những năm thập kỷ 60 Kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhưng hệ cơ sở. .. Một phân mảnh “tối ưu”là phân mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối đa thời gian thực thi các ứng dụng chạy trên mảnh đó Phân mảnh hỗn hợp Trong đa số các trường hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản cho một lược đồ CSDL không đủ đáp ứng các yêu cầu từ ứng dụng Trong trường hợp đó phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngược lại, sinh ra một lối phân hoạch... • Phân mảnh hỗn hợp (hibrid fragmentation) Chú ý là quá trình phân mảnh phải được gắn liền với vấn đề cấp phát dữ liệu và bài toán cụ thể như thế nào Phân mảnh ngang Phân mảnh ngang chia quan hệ theo các bộ Mỗi mảnh là một tập con của quan hệ Có hai loại phân mảnh ngang: phân mảnh nguyên thuỷ (primary horizontal fragmentation), thực hiện dựa trên các vị từ định nghĩa trên chính quan hệ đó, và phân mảnh. .. quản trị CSDL phân tán cần phải thực hiện hai điều: phân tán HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 12 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO hệ quản trị CSDL và phân tán các chương trình ứng dụng chạy trên hệ đó ở đây chúng ta chỉ tập trung vào việc phân tán dữ liệu Việc tổ chức các hệ phân tán có thể được nghiên cứu dựa theo ba trục không gian • Mức độ chia sẻ dữ liệu (level... chung đã chọn • Tích hợp các lược đồ địa phương vào lược đồ tổng thể Phân mảnh trong cơ sở dữ liệu phân toán Phân mảnh quan hệ Việc chia một quan hệ thành nhiều quan hệ nhỏ hơn được gọi là phân mảnh quan hệ HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016 Page 17 BÀI THU HOẠCH MÔN HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO Các lý do phải phân mảnh Trước tiên, khung nhìn của các ứng dụng thường chỉ là tập con của... HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO • Thuận lợi cho nhu cầu phát triển: Xu hướng dùng cơ sở dữ liệu phân tán sẽ cung cấp khả năng phát triển thuận lợi hơn và giảm được xung đột về chức năng giữa các đơn vị đã tồn tại và giảm được xung đột giữa các chương trình ứng dụng khi truy cập đến cơ sở dữ liệu Với hướng tập trung hoá, nhu cầu phát triển trong tương lai sẽ gặp khó khăn • Giảm chi phí truyền thông: Trong cơ. .. hệ thống phân tán như sau: • Phần mềm đắt và phức tạp • Phải xử lý mọi thay đổi thông báo trong mọi địa điểm • Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi nơi • Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bố phù hợp với việc sử dụng chung Thiết kế cơ sở dữ liệu phân tán Thiết kế của một hệ thống máy tính phân tán bao... về việc đặt dữ liệu và chương trình ở các trạm trên một mạng máy tính, cũng như là khả năng thiết kế chính mạng máy tính đó Trong trường hợp hệ thống quản lý CSDL phân tán, việc phân tán các ứng dụng gồm 2 điều: sự phân tán của phần mềm hệ thống quản lý CSDL phân tán và sự phân tán của các chương trình ứng dụng chạy trên phần mềm hệ thống đó Sự phân tán của các phần mềm hệ thống quản lý CSDL phân tán . HỌC: CƠ SỞ DỮ LIỆU NÂNG CAO MỤC LỤC LỜI NÓI ĐẦU 2 MỤC LỤC 3 1. CƠ SỞ DỮ LIỆU PHÂN TÁN 4 Tìm hiều về cơ sở dữ liệu phân tán 4 Thiết kế cơ sở dữ liệu phân tán 12 Phân mảnh trong cơ sở dữ liệu phân. dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống. Khái niệm cơ sở dữ liệu trong suốt mô tả hoạt động chương trình trên cơ sở. cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trưng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy được lợi ích của cơ sở dữ liệu phân tán. Đặc trưng mô tả cơ sở dữ liệu

Ngày đăng: 10/04/2015, 13:22

Từ khóa liên quan

Mục lục

  • 1. CƠ SỞ DỮ LIỆU PHÂN TÁN

  • 2. PHÂN MẢNH NGANG

  • 3. KẾT LUẬN

  • 4. TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan