Nghiên cứu một số kỹ thuật quản lý, truy vấn dữ liệu luồng liên tục

76 324 0
Nghiên cứu một số kỹ thuật quản lý, truy vấn dữ liệu luồng liên tục

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i LỜI CAM ĐOAN Tôi xin cam đoan, công trình nghiên cứu Trong có giúp đỡ tận tình thầy giáo hướng dẫn TS Hoàng Đỗ Thanh Tùng, thầy cô Viện CNTT, thầy cô giáo Trường Đại học Công nghệ Thông tin Truyền thông Các nội dung nghiên cứu kết đề tài hoàn toàn trung thực Trong luận văn, có tham khảo tài liệu số tác giả liệt kê phần Tài liệu tham khảo cuối luận văn Thái Nguyên, tháng 11 năm 2015 Tác giả Dương Hồng Minh ii LỜI CẢM ƠN Để hoàn thành chương trình luận văn, nhận hướng dẫn, giúp đỡ góp ý nhiệt tình quý thầy cô Trường Đại học Công nghệ Thông tin Truyền thông – Đại học Thái Nguyên Tôi xin chân thành cảm ơn đến quý thầy cô Trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên, quý thầy cô Viện CNTT, đặc biệt thầy cô tận tình dạy bảo cho suốt thời gian học tập trường Tôi xin gửi lời cảm ơn sâu sắc đến TS Hoàng Đỗ Thanh Tùng dành nhiều thời gian, tâm huyết bảo tận tình hướng dẫn nghiên cứu giúp hoàn thành luận văn Nhân đây, xin chân thành cảm ơn Ban giám hiệu, Phòng sau Đại học Trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên tạo điều kiện để học tập hoàn thành tốt khóa học Tôi xin chân thành cảm ơn! Thái Nguyên, tháng 11 năm 2015 Học viên thực Dương Hồng Minh iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC HÌNH vi DANH MỤC CÁC BẢNG vii PHẦN MỞ ĐẦU Chương 1: TỔNG QUAN VỀ DỮ LIỆU LUỒNG VÀ HỆ THỐNG QUẢN LÝ DỮ LIỆU LUỒNG 1.1 Tổng quan liệu luồng 1.1.1 Giới thiệu 1.1.2 Sự khác biệt liệu luồng sở liệu truyền thống 1.1.3 Một số ứng dụng 11 1.2 Những thách thức xây dựng hệ thống quản lý liệu luồng 14 1.2.1.Yêu cầu nhớ không hạn chế 14 1.2.2 Truy vấn xấp xỉ 17 1.2.3 Truy vấn cửa sổ trượt 17 1.2.4 Truy vấn khối 18 1.2.5 Xây dựng hệ thống quản lý liệu luồng 19 Chương 2: MỘT SỐ KỸ THUẬT TRONG QUẢN LÝ VÀ TRUY VẤN DỮ LIỆU LUỒNG 22 2.1 Kỹ thuật đánh số liệu luồng R-Tree 22 2.1.1 Khái niệm 23 2.1.2 Cấu trúc R-Tree .25 2.1.3 Thuật toán R-Tree 26 2.2 Kỹ thuật truy vấn liệu luồng 34 iv 2.2.1 Ngữ nghĩa truy vấn 34 2.2.2 Ngôn ngữ truy vấn 35 2.2.3 Kiến trúc truy vấn 36 2.2.4 Thuật toán 38 2.3 Phân tích lựa chọn công cụ 41 2.3.1 Microsoft StreamInsight 41 2.3.2 Ứng dụng Web thời gian thực sử dụng thư viện SignalR 48 Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 54 3.1 Bài toán Web thời gian thực 54 3.1.1.Bài toán 54 3.1.2 Vấn đề cần giải 54 3.1.3 Giải pháp đề xuất 55 3.2 Một số kết 58 3.2.1 Kết chương trình Streaming sử dụng StreamInsight 59 3.2.2 Kết ứng dụng chạy Web thời gian thực 62 PHẦN KẾT LUẬN 67 TÀI LIỆU THAM KHẢO 68 v DANH MỤC TỪ VIẾT TẮT Từ viết tắt Nghĩa tiếng Anh DBMS Data Base Management System DSMS Data Stream Management System CPU Central Processing Unit SQL Structured Query Language CQL Continuous Query Language SPE Stream Processing Engine URL Uniform Resource Locator HTTP Hypertext Transfer Protocol vi DANH MỤC CÁC HÌNH Hình 1.1: Xử lý liệu quản trị sở liệu Hình 1.2: Xử lý liệu hệ thống liệu luồng Hình 2.1: Ví dụ R-Tree 23 Hình 2.2: Trường hợp phân chia node (a) bad split, (b) good split .31 Hình 2.3: Phân chia phần tử thành nhóm node .32 Hình 2.4: Các kiểu liệu lớp hàm ngữ nghĩa trừu tượng 34 Hình 2.5: Mô hình kiến trúc xử lý truy vấn liên tục 36 Hình 2.6: Kiến trúc truy vấn liên tục luồng liệu 40 Hình 2.7: Nền tảng ứng dụng StreamInsight 42 Hình 2.8: Truy vấn ràng buộc 48 Hình 2.9: Mô hình gửi thông tin SignalR 50 Hình 2.10: Phương thức kết nối SignaIR 52 Hình 3.1: Kiến trúc tạo báo cáo Web sử dụng thuật toán truy vấn liên tục 54 Hình 3.2: Sơ đồ toán 56 Hình 3.3: Sơ đồ tổng thể toán 57 Hình 3.4: Lớp SimpleEventType 59 Hình 3.5: Các lớp gói SimulatedInputAdapter 59 Hình 3.6: Các lớp gói ConsoleOutput (hiển thị thông tin) 60 Hình 3.7: Báo cáo theo dòng 61 Hình 3.8: Chương trình Web 66 Hình 3.9: Kết hiển thị Web 66 vii DANH MỤC CÁC BẢNG Bảng 1.1: So sánh khác DBMS DSMS 10 Bảng 1.2: Ví dụ truy vấn liệu luồng S(A, B, C) T(D, E) 15 Bảng 1.3: Ký hiệu số truy vấn Q luồng S 16 PHẦN MỞ ĐẦU Công nghệ thông tin ngày phát triển, ứng dụng rộng rãi nhiều lĩnh vực đời sống kinh tế xã hội Theo thời gian, lượng liệu thông tin cần lưu trữ quan tổ chức, đơn vị, doanh nghiệp, người sử dụng… ngày tăng Do dung lượng liệu gia tăng không ngừng, yêu cầu ngày cao hiệu truy xuất, tính ổn định sẵn sàng liệu; việc lưu trữ trở nên quan trọng Lưu trữ liệu không đơn giản cung cấp thiết bị lưu trữ dung lượng lớn mà bao gồm khả quản lý, chia sẻ lưu phục hồi liệu trường hợp Mặt khác môi trường kinh tế đà hội nhập, phát triển cạnh tranh người ta ngày cần có nhiều thông tin cần truy vấn nhanh để hỗ trợ giúp đưa định ngày có nhiều câu hỏi, vấn đề cần phải trả lời, giải dựa khối lượng thông tin khổng lồ Các phương pháp lưu trữ, truy vấn sở liệu truyền thống ngày không đáp ứng yêu cầu thực tế đề ra, phát triển khuynh hướng kỹ thuật truy liệu luồng liên tục (Data Streaming) Streaming kỹ thuật xử lý truyền liệu theo luồng cách ổn định liên tục Trong mô hình luồng liệu, hoạt động tất liệu đầu vào không truy cập ngẫu nhiên từ ổ đĩa nhớ mà truy cập từ từ nhiều luồng liệu liên tục Ứng dụng trực tuyến không nhấn mạnh đến chế xử lý hệ thống quản lý liệu luồng, mà đưa thách thức cho việc quản lý liệu: Lớn, nhanh chóng thay đổi liệu cần phải xử lý với chi phí thấp nhớ CPU cung cấp truy cập hiệu thời gian đáp ứng đảm bảo thấp Giải khắc phục thách thức lưu trữ quản lý liệu, truy vấn liệu nhanh từ hỗ trợ cá nhân, doanh nghiệp đưa định nhanh chóng, kịp thời, hiệu quả, tăng doanh thu Luận văn tập trung tìm hiểu sở liệu truyền thống, sở liệu luồng liên tục, số kỹ thuật quản lý, truy vấn liệu luồng liên tục Lưu trữ liệu an toàn truy vấn liệu nhanh định thành công cá nhân, tổ chức, doanh nghiệp Vì vậy, học viên chọn: “Nghiên cứu số kỹ thuật quản lý, truy vấn liệu luồng liên tục” làm đề tài luận văn tốt nghiệp Nội dung luận văn gồm 03 chương: Chương 1: Tổng quan liệu luồng hệ thống quản lý liệu luồng Chương 2: Một số kỹ thuật quản lý luồng truy vấn liệu luồng Chương 3: Chương trình thử nghiệm Phần kết luận Tài liệu tham khảo Chương 1: TỔNG QUAN VỀ DỮ LIỆU LUỒNG VÀ HỆ THỐNG QUẢN LÝ DỮ LIỆU LUỒNG 1.1 Tổng quan liệu luồng 1.1.1 Giới thiệu Trong đầu năm 1920, George O.Squier cấp sáng chế cho hệ thống việc truyền tải phân phối tín hiệu qua đường dây điện, sở kỹ thuật cho sau trở thành Muzak, công nghệ Streaming âm nhạc liên tục cho khách hàng thương mại mà không cần sử dụng đài thu Đã có nhiều nỗ lực để hiển thị tập tin media máy tính từ ngày sơ khai công nghiệp máy tính kỷ 20 Tuy nhiên, có tiến thực nhiều thập kỷ, chủ yếu chi phí cao khả hạn chế phần cứng máy tính Đến năm 1990, máy tính cá nhân trở nên mạnh mẽ, đủ để hiển thị tập tin media khác vấn đề kỹ thuật chủ yếu liên quan đến Streaming CPU băng thông mainboard có đủ sức mạnh để hỗ trợ tốc độ liệu yêu cầu Trong thời gian cuối năm 1990 đầu năm 2000, băng thông mạng network lớn nhiều, đặc biệt cải tiến đường truyền đầu cuối – kết nối từ server tới người dùng truy cập Hơn nữa, Internet sử dụng giao thức định dạng tiêu chuẩn, chẳng hạn TCP/IP, HTTP HTML Thuật ngữ "Streaming" lần sử dụng năm 1990 mô tả công cụ giúp cho video theo yêu cầu mạng IP tực tốt Microsoft phát triển ứng dụng nghe nhạc biết đến với tên ActiveMovie vào năm 1995, cho phép streaming media bao gồm định dạng độc quyền cho streaming, tiền thân tính streaming sau Windows Media Player 6.4 vào năm 1999 Tháng năm 1999, Apple giới thiệu định dạng Streaming 55 khách hàng Vấn đề sống kinh doanh đưa chiến lược hợp lý cho giai đoạn mà phải kịp thời không tốn nhiều thời gian, nguồn lực chi phí Để hỗ trợ cho người quản lý có định kịp thời cho công ty cần có hệ thống báo cáo theo thời gian thực đảm bảo tính xác, thông tin rõ ràng có thông tin phân tích quản lý để trả lời câu hỏi “Các sản phẩm bán chạy ?”, “Mặt hàng có lợi nhuận cao nhất” “Doanh thu ngày hôm qua ?”… Thời gian thực báo cáo đề cập đến trình mà người dùng nhận báo cáo thời điểm liệu giao dịch xảy nơi hệ thống tổ chức Khách quan mà nói, thấy khả không thực "thực tế" vốn chịu ảnh hưởng nhiều yếu tố Báo cáo thời gian thực hiểu theo nghĩa giảm thời gian trễ tới xấp xỉ giây hay đến mili giây báo cáo cho kiện phát sinh 3.1.3 Giải pháp đề xuất Bài toán thử nghiệm đặt hệ thống siêu thị, người quản lý cần biết thông tin doanh thu, sản phẩm bán chạy, tổng số đơn hàng đến thời điểm ? Theo cách thông thường người quản lý cần chạy chương trình bấm truy vấn thông tin đến thời điểm tại, hệ thống cho kết tương ứng Theo cách người quản lý cần phải có thao tác bấm nút xử lý thông tin để có kết Bài toán đặt với người quản lý siêu thị cần theo dõi hệ thống bán hàng theo thời gian thực, người quản lý thông tin mặt hàng bán chạy, doanh thu đến thời điểm bao nhiêu… Làm thời gian, cần đến Streaming data để có biến động liệu hiển thị hình Input : + Đơn hàng 56 + Các sản phẩm thuộc đơn hàng + Tổng tiền Output: + Tổng doanh thu đến thời điểm + Tổng số đơn hàng đến thời điểm + Sản phẩm bán chạy đến thời điểm Khi có thay đổi hệ thống (Ví dụ: Chèn thêm liệu, xóa liệu, thay đổi thông tin liệu…) chương trình cần phải biết để lấy thông tin Thông thường muốn lấy thông tin cần phải truy vấn xuống hệ thống, làm tốn thời gian liệu có thay đổi hay không Còn Stream Insight giúp người quản lý có thay đổi lấy thông tin, thay đổi liệu cần thiết Từ sử dụng Streamlight để có thay đổi Stream Isight lấy liệu để xử lý thông tin Yêu cầu: Dữ liệu phải hiển thị liên tục, có biến động đơn hàng, doanh thu hệ thống hiển thị lên hình không cần phải tác động vào hệ thống Thu ngân Thu ngân Xử lý thông tin Báo cáo Thu ngân Thu ngân … Hình 3.2: Sơ đồ toán Các đơn hàng nhập liên tục thu ngân, sau đơn hàng lưu vào hệ thống sở liệu xử lý tổng hợp thông tin đưa 57 báo cáo Các liệu đầu vào thông tin đơn hàng, tổng tiền, sản phẩm thuộc đơn hàng Để xây dựng hệ thống trên, sử dụng liệu đầu vào tạo ngẫu nhiên hệ thống StreamInsight, phần liệu lưu vào sở liêụ, biến đổi “trung tâm” đầu chuyển đổi để hiển thị thông tin, chuyển đổi đưa phần thông tin tới Inmemory tables qua hiển Web thời gian thực Real time Web Input Stream Insight (IR) Q1 In Memory Input Q2 Tables Qn Input n Database Hình 3.3: Sơ đồ tổng thể toán Input: Dữ liệu đầu vào thời gian thực StreamInsight: Query liệu thời gian thực Output: Xuất liệu thời gian thực, panel theo dõi luồng liệu xuất In memory: Lưu liệu tạm thời IR: Hiển thị liệu thời gian thực Web Từ sơ đồ tổng thể toán hình 3.3, input liệu đầu vào qua 58 truy vấn (Q) cụ thể lưu lại kết IR (In Memory Tables) đẩy kết Bài toán muốn báo cáo thời gian thực Web, cần phải lưu trữ kết đẩy Web hình hiển thị máy tính Một phần liệu lưu trữ sở liệu Ở đây, toán muốn đảm bảo có thay đổi hệ thống, chương trình biết để lấy thông tin Cũng vậy, người quản lý thêm, thay đổi thông tin cần thiết, truy vấn liệu để đưa định cho công việc Hệ thống hiển thị chạy Web thời gian thực có ưu điểm không cần cài đặt, cần có Internet trình duyệt xem nơi Trong thực tế để xem báo cáo không thiết phải đến văn phòng công ty StreamInsight khó triển khai Web đặc biệt Web thời gian thực Output file XML, Web phải tự quét lấy file có thay đổi, qua ServiceWCF Kết hợp công nghệ Microsoft StreamInsight thêm bảng tạm nhớ quản lý truy vấn liên tục đầu Stream, nên dễ quản lý, triển khai độ trễ thấp Chúng nghĩ phương pháp xây dựng toán truy vấn liệu dựa tảng Stream Insight kết hợp thêm vào Web thời gian thực, để toán dễ hiểu Cũng trợ giúp người dùng quản lý, truy vấn, báo cáo thông tin cách đơn giản, dễ dàng SignalR thư viện dành cho ASP.NET nhằm đơn giản hóa việc xây dựng ứng dụng Web thời gian thực Chức thời gian thực khả máy chủ chủ động đẩy liệu cho Client Client kết nối tới máy chủ thay Client phải gửi yêu cầu làm liệu tới máy chủ SignalR thêm số tính ứng dụng web ASP.NET Framework 3.2 Một số kết Trong chương trình thử ngiệm xây dựng hai hệ thống kết hợp với sử dụng StreamInsight xử lý liệu liên tục kết hợp với hiển thị thông tin Web thời gian thực thông qua thư viện SignalR Sự kết hợp StreamInsight SignalR nhằm tạo giải pháp hoàn thiện bao gồm hệ 59 thống liệu riêng hệ thống hiển thị riêng Hệ thống thị chạy Web thời gian thực có ưu điểm không cần cài đặt, cần có Internet trình duyệt xem nơi Trong thực tế để xem báo cáo không thiết phải đến văn phòng công ty 3.2.1 Kết chương trình Streaming sử dụng StreamInsight StreamInsight sinh ngẫu nhiên liệu theo thời gian định kỳ Dự án đầu tiên, có lớp SimpleEventType lớp chuyển đổi tùy chỉnh dùng để sinh kiện ngẫu nhiên gửi kiện đến xử lý StreamInsight Hình 3.4: Lớp SimpleEventType Tiếp theo ta xây dựng lớp liệu đầu vào: SimulatedInputAdapter để sinh liệu Hình 3.5: Các lớp gói SimulatedInputAdapter 60 Các lớp chính: + Lớp SimulatedInputAdapterConfig: Đây loại cấu hình cho lớp SimulatedDataInputFactory Sử dụng trường hợp lớp để cấu hình chuyển đổi liệu đầu vào theo mô kiện + Lớp SimulatedInputPointAdapter: Mô chuyển đổi đầu vào cho kiện Định kỳ làm tăng liệu kiện mô Nếu lớp thực thông qua ItypeInitializer giao diện quy định cấu hình kiện điền vào thể lớp Các lớp liệu : Hình 3.6: Các lớp gói ConsoleOutput (hiển thị thông tin) Lớp: ConsoleAdapterConfig : Cấu hình đầu liệu Lớp ConsoleAdapterFactory: Tạo thể chuyển đổi đầu giao diện điều khiển kiện nhận đến cửa sổ NETgỡ lỗi theo cửa sổ dòng lệnh (Console) Tiếp theo ta tạo ứng dụng streaming set thời gian cập nhật kiện Trong chương trình sử dụng thời gian đặt kiện với thời gian 500 mili giây Application cepApplication = cepServer.CreateApplication("simple"); var input = CepStream.Create("inputStream", typeof(SimulatedInputFactory), SimulatedInputAdapterConfig() { CtiFrequency = 1, EventPeriod = 500, // thoi gian cap nhat su kien new 61 EventPeriodRandomOffset = 0, TypeInitializer = typeof ( SimpleEventTypeFiller ) AssemblyQualifiedName }, EventShape.Point); Kết chạy chương trình sử dụng StreamInsight Các liệu dùng toán tạo ngẫu nhiên SimpleEventType.cs, cấu trúc kiện tạo SimpleEventType.cs gồm ba đối tượng “Doanh số”, “Sản phầm bán chạy” “số đơn hàng” Trong luồng liệu đầu vào cho toán, liệu sinh sau 500 mini giây lần Ta theo dõi liệu thời gian sinh qua báo cáo hình Các liệu hiển thị chi tiết với số lượng theo hàng Hình 3.7: Báo cáo theo dòng Kết hiển thị có biến động doanh thu Kết hiển thị doanh thu gồm doanh thu biến đổi tổng doanh thu Tiếp theo sản phẩm bán chạy đến thời điểm 62 3.2.2 Kết ứng dụng chạy Web thời gian thực Việc báo cáo môi trường thực chương trình chạy, mang tính chất thông báo chạy máy Việc hiển thị liệu bên cần ứng dụng khác, truy cập lúc, nơi thông qua môi trường Internet Trong ví dụ sử dụng thư viện SignalR Microsoft kết hợp với với Web server chạy ứng dụng thông qua môi trường Web Khi có thay đổi, liệu viết hình, đồng thời lưu xuống sở liệu để lưu trữ Trong trình lưu liệu xuống sở liệu, liệu đọc hiển thị Web server Các lớp chương trình: Messages: Lớp hiển thị thông tin thông báo public class Messages { public int MessageID { get; set; } // ID public string Message { get; set; } // Ten Thong bao public string EmptyMessage { get; set; } // public DateTime MessageDate { get; set; } // thoi gian } Tiếp theo ta xây dựng lớp MessagesRepository dùng để lắng nghe thay đổi từ CSDL, đọc thông tin từ database public class MessagesRepository { readonly string _connString =ConfigurationManager.ConnectionStrings["DefaultConnection"].ConnectionString; public IEnumerable GetAllMessages() 63 { var messages = new List(); // luu cac thong bao // doc dư lieu tu database using (var connection = new SqlConnection(_connString)) { connection.Open(); using (var command = new SqlCommand(@"SELECT [MessageID], [Message], [EmptyMessage], [Date] FROM [dbo].[Messages]", connection)) { command.Notification = null; var dependency = new SqlDependency(command); dependency.OnChange += new OnChangeEventHandler(dependency_OnChange); if (connection.State == ConnectionState.Closed) connection.Open(); var reader = command.ExecuteReader(); while (reader.Read()) { messages.Add(item: (int)reader["MessageID"], EmptyMessage = new Message : Convert.ToDateTime(reader["Date"]) }); } = { MessageID = (string)reader["Message"], reader["EmptyMessage"] != DBNull.Value ? (string) reader["EmptyMessage"] } Messages "", MessageDate = 64 } return messages; } /* * Lớp thực có sụ thay đổi liệu * Đọc thông báo đẩy kết */ private void dependency_OnChange(object sender, SqlNotificationEventArgs e) { if (e.Type == SqlNotificationType.Change) { MessagesHub.SendMessages(); } } } Hiển thị liệu: Sau thông báo, liệu hiển thị thông qua việc kết hợp Ajax Javascripts Xây dụng file Index.cshtml $(function () { // Declare a proxy to reference the hub var notifications = $.connection.messagesHub; // Create a function that the hub can call to broadcast messages notifications.client.updateMessages = function () { getAllMessages() 65 }; // Bắt đầu connect $.connection.hub.start().done(function () { // Thong bao viec ket noi den server da than cong alert("connection started") getAllMessages(); }).fail(function (e) { alert(e); }); }); // lay thong bao Ajax function getAllMessages() { var tbl = $('#messagesTable'); $.ajax({ url: '/home/GetMessages', contentType: 'application/html ; charset:utf-8', type: 'GET', dataType: 'html' }).success(function (result) { tbl.empty().append(result); }).error(function () { }); } 66 Hình 3.8: Chương trình Web Kết hiển thị Web: Khi có thay đổi doanh thu, tổng doanh thu tổng doanh thu + số lương doanh thu thay đổi Hình 3.9: Kết hiển thị Web 67 PHẦN KẾT LUẬN Các phương pháp lưu trữ, truy vấn sở liệu truyền thống ngày không đáp ứng yêu cầu thực tế đề ra, phát triển khuynh hướng kỹ thuật truy liệu luồng liên tục (Data Streaming) Streaming kỹ thuật xử lý truyền liệu theo luồng cách ổn định liên tục Xuất phất hoàn cảnh đó, luận văn tập trung nghiên cứu khái niệm tổng quát lý thuyết giải pháp Data Streaming, kỹ thuật hỗ trợ giải toán “Truy vấn liên tục” dùng lớp báo cáo Luận văn đạt kết sau: + Trình bày tổng quan liệu luồng, khác biệt liệu luồng sở liệu truyền thống, số ứng dụng liệu luồng + Hệ thống hóa số kỹ thuật quản lý truy vấn liệu luồng + Cài đặt thử nghiệm chương trình sử dụng tảng StreamInsight kết hợp báo cáo Web thời gian thực giải toán truy vấn liên tục Hướng phát triển: Hiện tại, luận văn dừng lại việc tìm hiểu tổng quan hệ thống kỹ thuật hỗ trợ luồng liệu liên tục Sử dụng tảng công nghệ Microsoft StreamInsight để bắt gói liệu liên tục tạo lớp ứng dụng Vì chưa thể khả hoạt động thực tế nguồn cung cấp liệu liên tục từ nhiều vị trí khác hệ thống kinh doanh thực Hướng phát triển đề tài triển khai hệ thống hóa, áp dụng vào hệ thống ứng dụng cụ thể, tham gia vào trình xây dựng hệ thống báo cáo liên tục cho tổ chức/doanh nghiệp Tôi tiếp cận với lĩnh vực Data Streaming nên đề tài thiếu sót Tôi mong nhận nhiều ý kiến đóng góp chuyên môn, cách trình bày luận văn từ quý thầy cô bạn 68 TÀI LIỆU THAM KHẢO * Tài liệu tiếng nước [1] Brian Babcock, Shivnath Babu, Mayur Datar, Rajeev Motwani, Jennifer Widom, Models and Issues in Data Stream Systems, Department of Computer Science, Stanford University, PODS 2002, Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems, http://dl.acm.org/citation.cfm?id=543615 [2] Arvind Arasu, Brian Babcock, Shivnath Babu, John Cieslewicz, Mayur Datar, Keith Ito, Rajeev Motwani, Utkarsh Srivastava, and Jennifer Widom, STREAM: The Stanford Data Stream Management System, Department of Computer Science, Stanford University, December 2008, http:// ilpubs stanford edu:8090/641/1/2004-20.pdf [3] Shivnath Babu and Jennifer Widom, Continuous Queries over Data Streams, StanfordUniversity, Newsletter ACM SIGMOD Record Volume 30 Issue 3, September 2001, http://dl.acm.org/citation.cfm?id=603884 [4] Samuel Madden, Michael J Franklin, Fjording the Stream: An Architecture for Queries over Streaming Sensor Data, University of California, Berkeley, June 2001, www.cs.berkeley.edu/~franklin/Papers/ fjord s0601.pdf [5] Sirish Chandrasekaran, Michael J Franklin, Streaming Queries over Streaming Data, University of California, Berkeley, VLDB 2002, Proceedings of the 28th international conference on Very Large Data Bases, http://dl.acm.org/citation.cfm?id=1287388&bnc=1 [6] Bei Pan, Ugur Demiryurek, Farnoush Banaei-Kashani and Cyrus Shahabi, Spatiotemporal Summarization of Traffic Data Streams, Department of Computer Science, University of Southern California, Los Angeles, IWGS 2010, Proceedings of the ACM SIGSPATIAL International Workshop on GeoStreaming, http://dl.acm.org/citation.cfm?id=1878504 69 [7] Gutman A (1984) – “R-Tree: A Dynamic Index Structure For Spatial Searching” – Procesdings of the ACM SIGMOD Confernece, pp 44-57 [8] Kame I, Faloutos C (1994) Hilbert – “R-Tree: An Improved R-Tree Using Fractals” – Proceedings of the VLDB Conference, pp 144 - 155 ... thu Luận văn tập trung tìm hiểu sở liệu truy n thống, sở liệu luồng liên tục, số kỹ thuật quản lý, truy vấn liệu luồng liên tục Lưu trữ liệu an toàn truy vấn liệu nhanh định thành công cá nhân,... chung truy vấn liên tục, kế hoạch truy vấn lần định nghĩa trước Mặt khác, truy vấn bột phát sau luồng liệu bắt đầu công khai Truy vấn bột phát truy vấn lần truy vấn liên tục Thiết kế hệ thống quản. .. 18 1.2.5 Xây dựng hệ thống quản lý liệu luồng 19 Chương 2: MỘT SỐ KỸ THUẬT TRONG QUẢN LÝ VÀ TRUY VẤN DỮ LIỆU LUỒNG 22 2.1 Kỹ thuật đánh số liệu luồng R-Tree 22 2.1.1 Khái

Ngày đăng: 15/04/2017, 21:10

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan