Thiết kế cơ sở dữ liệu phân tán để tổ chức khai thác thông tin về giao thông

71 650 0
Thiết kế cơ sở dữ liệu phân tán để tổ chức khai thác thông tin về giao thông

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

- i - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ LAN ANH THIẾT KẾ SỞ DỮ LIỆU PHÂN TÁN ĐỂ TỔ CHỨC KHAI THÁC THÔNG TIN VỀ GIAO THÔNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2014 - ii - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ LAN ANH THIẾT KẾ SỞ DỮ LIỆU PHÂN TÁN ĐỂ TỔ CHỨC KHAI THÁC THÔNG TIN VỀ GIAO THÔNG CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC PGS. TS ĐỖ TRUNG TUẤN Thái Nguyên - 2014 - iii - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Lời cảm ơn Để hoàn thành chƣơng trình cao học và viết luận văn này, em đã nhận đƣợc sự giúp đỡ và đóng góp nhiệt tình của các thầy trƣờng Đại học Công nghệ Thông tin và Truyền Thông, Đại học Thái Nguyên. Trƣớc hết, em xin chân thành cảm ơn các thầy trong bộ phận Đào tạo sau đại học, Đại học Công nghệ thông tin và Truyền thông, trƣờng Đại học Thái Nguyên đã tận tình giảng dạy, trang bị cho em những kiến thức quý báu trong suốt những năm học qua. Em xin gửi lời biết ơn sâu sắc tới PGS. TS Đỗ Trung Tuấn đã dành rất nhiều thời gian và tâm huyết hƣớng dẫn, chỉ bảo em trong suốt quá trình thực hiện đề tài. Xin chân thành cảm ơn gia đình, bạn bè đã nhiệt tình ủng hộ, giúp đỡ, động viên cả về vật chất lẫn tinh thần trong thời gian học tập và nghiên cứu. Trong quá trình thực hiện luận văn, mặc đã rất cố gắng nhƣng cũng không tránh khỏi những thiếu sót. Kính mong nhận đƣợc sự cảm thôngtận tình chỉ bảo của các thầy và các bạn. - iv - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Lời cam đoan Luận văn thạc sỹ này tôi nghiên cứu và thực hiện dƣới sự hƣớng dẫn của PGS.TS Đỗ Trung Tuấn. Để hoàn thành bản luận văn này, ngoài các tài liệu đã liệt kê, tôi cam đoan không sao chép các công trình hoặc đồ án tốt nghiệp của ngƣời khác. Tác giả NGUYỄN THỊ LAN ANH - v - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ MỤC LỤC Lời cảm ơn i Lời cam đoan iv MỤC LỤC v Danh mục hình vẽ vii Danh mục các từ viết tắt viii MỞ ĐẦU 1 CHƢƠNG 1. 3 SỞ DỮ LIỆU PHÂN TÁN 3 1.1. sở dữ liệu tập trung 3 1.2. sở dữ liệu phân tán 3 1.2.1. Khái niệm sở dữ liệu phân tán 3 1.2.3. Các hình thức tổ chức hệ thống phân tán 4 1.2.4. Ƣu nhƣợc điểm của hệ phân tán 6 1.2.5. Kiến trúc bản của CSDL phân tán 6 1.3. So sánh sở dữ liệu phân tán sở dữ liệu tập trung 9 1.4. Sự cần thiết của sở dữ liệu phân tán 12 1.5. Kết luận chƣơng 14 CHƢƠNG 2. 15 THIẾT KẾ SỞ DỮ LIỆU PHÂN TÁN 15 2.1. Các vấn đề về phân mảnh dữ liệu 15 2.1.1. Lý do phân mảnh 15 2.1.2. Các kiểu phân mảnh 16 2.1.3. Mức độ phân mảnh 16 2.1.4. Các quy tắc phân mảnh 17 2.1.5. Các kiểu cấp phát 17 2.1.6. Các yêu cầu thông tin 18 2.2. Các phƣơng pháp phân mảnh 19 2.2.1. Phân mảnh dữ liệu ngang 19 2.2.2. Phân mảnh dọc 24 2.2.3. Phân mảnh hỗn hợp 27 2.3. Cấp phát 27 2.3.1. Bài toán cấp phát 27 2.3.2. Yêu cầu về thông tin 28 2.3.3. Mô hình cấp phát 29 2.4. Truy vấn trong sở dữ liệu phân tán 31 2.4.1. Mục đích của xử lý truy vấn 31 2.4.2. Các tầng của quá trình xử lý truy vấn 32 2.5. Kĩ thuật thực hiện phép nối và phép hợp của đại số quan hệ 33 2.5.1. Phép chọn 35 2.5.2. Phép nối 36 2.5.3. Phân mảnh 38 - vi - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 2.7. Kết luận chƣơng 43 CHƢƠNG 3. 44 THIẾT KẾ SỞ DỮ LIỆU VỀ CÁC CUNG ĐƢỜNG THÁI NGUYÊN 44 3.1. Phát biểu bài toán 44 3.2. Thiết kế sở dữ liệu phân tán các cung đƣờng 45 3.2.1. Thiết kế lƣợc đồ quan hệ tổng thể 45 3.2.2. Thiết kế phân mảnh 52 3.2.3. Thiết kế định vị 54 3.2.4. Thiết kế đồ ánh xạ địa phƣơng 54 3.2.5. Thiết kế hệ thống mạng cho hệ thống 55 3.3. Cài đặt ứng dụng 56 3.3.1. Cấu hình các Server 56 3.3.2. Môi trƣờng hoạt động 57 3.3.3. Công nghệ sử dụng 57 3.4. Giới thiệu chƣơng trình 59 3.4.1. Mục tiêu mà hệ thống đạt đƣợc 59 3.4.2.Cấu trúc chƣơng trình 59 3.4.3. Một số giao diện chính 60 3.5. Kết luận chƣơng 61 KẾT LUẬN 62 Kết quả đạt đƣợc 62 Hƣớng nghiên cứu tiếp 62 Tài liệu tham khảo 63 - vii - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Danh mục hình vẽ Hình 1.1. Mô hình CSDL phân tán 4 Hình 1.2. Mô hình Peer-to-peer 4 Hình 1.3. Mô hình File Server 5 Hình 1.4. Mô hình Client Server 5 Hình 1.5. Kiến trúc bản của CSDL phân tán 6 Hình 1.6. Các phân mảnh và mô hình vật lý cho một quan hệ toàn cục 8 Hình 2.1 So sánh các phƣơng pháp nhân bản 18 Hình 2.1. Lƣợc đồ phân tầng tổng quát để xử lý truy vấn phân tán 33 Hình 2.2. Rút gọn phân mảnh ngang với phép chọn 35 Hình 2.3a. Cây đại số quan hệ truy vấn gốc 37 Hình 2.3b. Rút gọn phân mảnh ngang với phép kết nối 38 Hình 2.5. Rút gọn cho phân mảnh gián tiếp 42 Hình 2.6. Rút gọn phân mảnh hỗn hợp 43 Hình 3.1. Tỉnh Thái Nguyên 44 Hình 3.2. Cần thiết an toàn giao thông 45 Bảng 1. Cấu trúc bảng HUYEN 46 Bảng 2. Cấu trúc bảng DUONG 47 Bảng 3. Cấu trúc bảng LOAIMADUONG 47 Bảng 4. Cấu trúc bảng KIEUDUONG 48 Bảng 5. Cấu trúc bảng TOCHUCGIAOTHONG 48 Bảng 6. Cấu trúc bảng MUCDOHUHONG 49 Bảng 7. Cấu trúc bảng LOAIBAOTRI 49 Bảng 8. Cấu trúc bảng DONVITHICONG 50 Bảng 9. Cấu trúc bảng THONGTINBAOTRI 51 Hình 3.3. đồ về mối quan hệ 51 Hình 3.3. đồ định vị của các mảnh tại các vị trí 54 Hình 3.3. Các mảnh và hình ảnh vật lý của một quan hệ tổng thể 55 Hình 3.3. Mô hình mạng của hệ thống quản lí các cung đƣờng 56 Hình 3.7. Giao diện form quản lý thông tin cung đƣờng 60 Hình 3.8. Giao diện form quản lý thông tin bảo trì 61 Hình 3.9. Giao diện form tìm kiếm cung đƣờng 61 - viii - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Danh mục các từ viết tắt DBMS Database Management System ADSL Đƣờng truyền bất đối xứng Asymmetric Digital Subscriber Line C# Ngôn ngữ lập trình CPU Central Processing Unit CSDL sở dữ liệu CSDLPT sở dữ liệu phân tán DB2 Hệ quản trị sở dữ liệu DB2 của IBM DHM Highway Development and Management System ER Entity-Relationship ETL Extract Transform Load IMS Information Management System LAN Local Area Network Mainframe Máy tính mainframe MDX Multidimensional eXpressions MSIL MicroSoft Intermediate Language MSSQL Microsoft SQL Server NT Network Technology ORACLE Hệ quản trị sở dữ liệu ORACLE Partition Phân đoạn PC Máy vi tính, máy cá nhân SQL Structured Query Language XML Extensible Markup Language - 1 - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Trong hệ thống kết cấu hạ tầng kinh tế - xã hội, hạ tầng giao thông vận tải đóng vai trò rất quan trọng trong việc tạo điều kiện đi lại thuận lợi cho nhân dân, giao thƣơng hàng hóa, thúc đẩy tăng trƣởng kinh tế, giảm nhẹ thiên tai, phòng thủ quốc phòng, cải thiện đời sống cho nhân dân, do đó phải ƣu tiên phát triển. Nhiều cung đƣờng liên tỉnh, liên huyện, liên xã đƣợc bảo trì, nâng cấp, nhiều cung đƣờng mới đƣợc mở rộng. Vì vậy khối lƣợng thông tin về giao thông ngày càng lớn, phong phú và đa dạng, cần phải quản lý thông tin này một cách khoa học. Hiện tại, Sở Giao thông Thái Nguyên quản lý các thông tin này theo cách thức sau: các đơn vị quản lý giao thông tại các cung đƣờng thƣờng xuyên báo cáo về các Sở giao thông nhƣ: lƣu lƣợng tham gia giao thông, số vụ tai nạn xảy ra, chất lƣợng các cung đƣờng, công tác bảo dƣỡng duy tu, giám sát cung đƣờng, Với và cách thức tổ chức đó sẽ tốn thời gian và dữ liệu thể không đồng bộ. Để khắc phục những nhƣợc điểm trên cần áp dụng công nghệ thông tin vào trong quá trình quản lý. Vì vậy tôi đã chọn đề tài “Thiết kế sở dữ liệu phân tán để tổ chức khai thác thông tin về giao thông” làm đề tài luận văn tốt nghiệp của mình. Đối tƣợng và phạm vi nghiên cứu. Đối tƣợng nghiên cứu của đề tài gồm: Nghiên cứu về CSDL phân tán, thiết kế CSDL phân tán nhƣ: các vấn đề về thiết kế phân tán, các phƣơng pháp thiết kế phân tán, phƣơng pháp phân mảnh, cấp phát cho các mảnh, … tìm hiểu Các thông tin về giao thông. Ứng dụng lý thuyết thiết kế CSDL phân tán vào hệ thống. Ứng dụng khả năng quản trị CSDL phân tán của SQL Server và Visual Studio vào hệ thống. Trong phạm vi thực hiện của đề tài sẽ phân tích, thiết kế sở dữ liệu các cung đƣờng trên địa bàn tỉnh Thái Nguyên. - 2 - Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hƣớng nghiên cứu của đề tài : Nghiên cứu và ứng dụng CSDL phân tán, tìm hiểu, thu thập các thông tin về giao thông. Từ những thông tin thu thập đƣợc phân tích, thiết kế CSDL phân tán để quản lý các thông tin đó Phƣơng pháp nghiên cứu : Để thực hiện đƣợc mục tiêu và nhiệm vụ đặt ra trong đề tài, tôi áp dụng hai phƣơng pháp nghiên cứu đó là: phƣơng pháp nghiên cứu lý thuyết và phƣơng pháp nghiên cứu thực nghiệm. Đối với phƣơng pháp nghiên cứu lý thuyết: tôi tiến hành nghiên cứu và thu thập các tài liệu liên quan đến CSDL phân tán, thiết kế CSDL phân tán, các công cụ thể triển khai quản trị CSDL phân tán. Tiếp đến tôi thu thập các tài liệu liên quan đến thông tin về hệ thống các cung đƣờng. Đối với phƣơng pháp thực nghiệm: tôi phân tích yêu cầu thực tế của hệ thốngđể xác định đƣợc các chức năng, quy trình hoạt động của hệ thống. Tiếp theo vận dụng sở lý thuyết liên quan nhƣ CSDL phân tán, thiết kế CSDL phân tán vào thiết kế hệ thống, sử dụng công cụ SQL Server và Visual Studio để quản trị CSDL phân tán và công cụ thiết kế giao diện và cuối cùng đánh giá kết quả đạt đƣợc. Ý nghĩa khoa học của đề tài : Việc ứng dụng CSDL phân tán để quản lý dữ liệu về các cung đƣờng hiện nay là vấn đề quan trọng và cần thiết cho những ngƣời làm công tác quản lý giao thông vận tải cái nhìn chính xác, và đƣa ra quyết định kịp thời. Bố cục của luận văn Luận văn chia thành các chƣơng: 1. Chƣơng 1: Tổng quan về sở dữ liệu phân tán 2. Chƣơng 2: Thiết kế sở dữ liệu phân tán 3. Chƣơng 3: Thiết kế, xây dựng sở dữ liệu các cung đƣờng tại Thái Nguyên Cuối luận văn là phần kết luận và tài liệu tham khảo. [...]... dùng để phối hợp các kiểu khác nhau của DBMS… 1.3 So sánh sở dữ liệu phân tán sở dữ liệu tập trung sở dữ liệu tập trung cùng với sở dữ liệu không qua thiết kế hình thành trƣớc khi sở dữ liệu phân tán Hai hình thức này phát triển trên sở tự phát và hệ thống tập trung Nhƣ vậy hai hình thức này không đáp ứng đƣợc yêu cầu tổ chức và công việc trên phạm vi lớn sở dữ liệu phân tán. .. khiển tập trung các nguồn thông tin của công việc hay tổ chức ngƣời quản trị đảm bảo an toàn dữ liệu Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập trung Ngƣời quản trị sở dữ liệu chung phân quyền cho ngƣời quản trị sở dữ liệu địa phƣơng b) Độc lập dữ liệu Độc lập dữ liệu là một trong những nhân tố tác động đến cấu trúc sở dữ liệu để tổ chức dữ liệu chuyển cho chƣơng... tâm Học liệu http://www.lrc-tnu.edu.vn/ - 15 - CHƢƠNG 2 THIẾT KẾ SỞ DỮ LIỆU PHÂN TÁN 2.1 Các vấn đề về phân mảnh dữ liệu Phần lớn các hệ cơ sở dữ liệu phân tán đƣợc thiết kế theo hƣớng từ trên xuống (TopDown) Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện Mục đích của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát logic, sao cho chi phí để thực hiện truy vấn thông tin là thấp... lập dữ liệu là các chƣơng trình ứng dụng không bị ảnh hƣởng khi thay đổi cấu trúc vật lý Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ - 10 - của dữ liệu Trong cơ sở dữ liệu phân tán, độc lập dữ liệu tầm quan trọng cũng nhƣ trong sở dữ liệu truyền thống Khái niệm sở dữ liệu trong suốt mô tả hoạt động chƣơng trình trên cơ sở dữ liệu phân tán đƣợc viết nhƣ làm việc trên sở dữ liệu. .. đƣợc thiết kế khác sở dữ liệu tập trung Do đó cần đối sánh các đặc trƣng của sở dữ liêu phân tán với sở dữ liệu tập trung để thấy đƣợc lợi ích của sở dữ liệu phân tán Đặc trƣng mô tả sở dữ liệu tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dƣ thừa, cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tƣơng tranh, biệt lập và an toàn dữ liệu. .. thông tin Công việc thiết kế sở dữ liệu phân tán phụ thuộc rất nhiều vào các yếu tố là ảnh hƣởng đến một thiết kế tối ƣu, tổ chức logic sở dữ liệu, vị trí các ứng dụng, đặc tính truy cập của các ứng dụng đến sở dữ liệu và các đặc tính của hệ thống máy tính tại mỗi vị trí Điều này làm cho việc diễn đạt bài toán phân tán trở nên hết sức phức tạp Các thông tin cần thiết cho thiết kế phân tán. .. truy cập đến sở dữ liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị sở dữ liệu, thiết lập đƣờng truyền Trong sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến sở dữ liệu Hiệu quả nghĩa là thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất Mỗi cách thức truy cập sở dữ liệu phân tán viết bởi... Trong CSDL phân tán, những ngƣời quản trị địa phƣơng cũng phải giải quyết vấn đề tƣơng tự nhƣ ngƣời quản trị sở dữ liệu truyền thống 1.4 Sự cần thiết của sở dữ liệu phân tán a) Sự phát triển của các cấu tổ chức Cùng với sự phát triển của xã hội, nhiều quan, xí nghiệp cấu tổ chức không tập trung, hoạt động phân tán trên phạm vi rộng Vì vậy thiết kế và cài đặt sở dữ liệu phân tán là... cả dữ liệu đƣợc chứa trong sở dữ liệu phân tán nhƣ trong sở dữ liệu tập trung Vì vậy, lƣợc đồ toàn cục đƣợc định nghĩa chính xác nhƣ định nghĩa lƣợc đồ sở dữ liệu tập trung Tuy nhiên, mô hình dữ liệu lƣợc đồ toàn cục cần phải tƣơng thích với việc định nghĩa các ánh xạ tới các mức của sở dữ liệu phân tán Vì vậy mô hình dữ liệu quan hệ sẽ đƣợc sử dụng trong kiến trúc mô hình tham chiếu sở. .. kế phân tán bao gồm: Thông tin sở dữ liệu Thông tin ứng dụng Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ - 19 - Thông tin về mạng Thông tin về hệ thống máy tính Yêu cầu thông tin về mạng và hệ thống máy tính chỉ đƣợc sử dụng trong các mô hình cấp phát, không sử dụng trong các thuật toán phân mảnh dữ liệu 2.2 Các phƣơng pháp phân mảnh 2.2.1 Phân mảnh dữ liệu ngang Phân mảnh ngang chính . Cơ sở dữ liệu phân tán đƣợc thiết kế khác cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trƣng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy đƣợc lợi ích của cơ sở dữ liệu. 1: Tổng quan về cơ sở dữ liệu phân tán 2. Chƣơng 2: Thiết kế cơ sở dữ liệu phân tán 3. Chƣơng 3: Thiết kế, xây dựng cơ sở dữ liệu các cung đƣờng tại Thái Nguyên Cuối luận văn là phần kết. trúc cơ bản của CSDL phân tán 6 1.3. So sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung 9 1.4. Sự cần thiết của cơ sở dữ liệu phân tán 12 1.5. Kết luận chƣơng 14 CHƢƠNG 2. 15 THIẾT KẾ

Ngày đăng: 18/06/2014, 12:11

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan