TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO Massive Parallel Processing for Large Scale Database

18 434 0
TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO Massive Parallel Processing for Large Scale Database

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 Massive Parallel Processing for Large Scale Database Giảng viên : Nguyễn Hà Nam Nhóm 12 : Lê Hồng Hà Đào Thị Thu Hiền 2 Các nội dung trình bày  Sự cần thiết của MPP và Large Scale Database  Phương hướng thực thi MPP  Một số hệ thống cơ sở dữ liệu thực thi MPP hiện nay 3 Sự cần thiết của MPP và Large Scale Database  Có rất nhiều những dịch vụ trên thế giới cho phép người dùng có thể truy cập bất cứ nơi đâu, bất cứ lúc nào.  Công nghệ Web Service phát triển nhanh chóng.  DBMS sử dụng đơn CPU không thể xử lý hiệu quả lượng dữ liệu cỡ terabyte ở tốc độ hàng chục nghìn TPS.  Dễ dàng mở rộng lên tới hàng nghìn node 4 Phương hướng thực thi MPP  Kiến trúc Share-nothing  Parallel DBMS  Mô hình lập trình MapReduce 5 MapReduce  Là một mô hình lập trình được giới thiệu bởi Google  Dùng để xử lý, phân tích song song lượng dữ liệu lớn, phân tán trên hàng nghìn máy khác nhau  Cấu trúc gồm có hàm Map và Reduce 6 Ví dụ MapReduce 7 Một số hệ thống cơ sở dữ liệu thực thi MPP  HadoopDB  Aster Data Database 8 HadoopDB  Dựa trên SQL và hệ thống Hadoop (MapReduce)  Sử dụng RDBMS  Sử dụng Hive để thực thi pseudo-SQL trên HDFS (Hadoop Distributed File System)  Có khả năng mở rộng tốt giống như Hadoop trong khi vẫn đảm bảo được hiệu năng tốt trong phân tích dữ liệu 9 Kiến trúc của HadoopDB 10 Truy vấn dữ liệu trên HadoopDB [...]... WordCount ( ON (select line from book_table) ) GROUP BY word 16 Tham khảo     http://www.asterdata.com/ http://db.cs.yale.edu/hadoopdb/hadoopd b.html http://www.cubrid.org/blog/devplatform /database- technology -for- largescale-data/ http://hadoop.apache.org/ 17 Xin chân thành cảm ơn! 18 ...Aster Data Database 11 Aster Data Database   Aster Data Database hỗ trợ SQLMapReduce và SQL chuẩn Các hàm MapReduce có thể tích hợp vào trong SQL SELECT FROM functionname( ON table-or-query [ PARTITION BY expr ] [ ORDER BY expr ] [ clausename ( arg ) ] ) 12 Aster Data Database 13 SQL-MapReduce Function 14 SQL-MapReduce Function 15 SQL-MapReduce . 1 Massive Parallel Processing for Large Scale Database Giảng viên : Nguyễn Hà Nam Nhóm 12 : Lê Hồng Hà Đào Thị Thu Hiền 2 Các nội dung trình bày  Sự cần thiết của MPP và Large Scale Database  Phương. được hiệu năng tốt trong phân tích dữ liệu 9 Kiến trúc của HadoopDB 10 Truy vấn dữ liệu trên HadoopDB 11 Aster Data Database 12 Aster Data Database  Aster Data Database hỗ trợ SQL- MapReduce và. lượng dữ liệu lớn, phân tán trên hàng nghìn máy khác nhau  Cấu trúc gồm có hàm Map và Reduce 6 Ví dụ MapReduce 7 Một số hệ thống cơ sở dữ liệu thực thi MPP  HadoopDB  Aster Data Database 8 HadoopDB  Dựa

Ngày đăng: 08/07/2015, 16:08

Mục lục

  • Massive Parallel Processing for Large Scale Database

  • Các nội dung trình bày

  • Sự cần thiết của MPP và Large Scale Database

  • Phương hướng thực thi MPP

  • MapReduce

  • Ví dụ MapReduce

  • Một số hệ thống cơ sở dữ liệu thực thi MPP

  • HadoopDB

  • Kiến trúc của HadoopDB

  • Truy vấn dữ liệu trên HadoopDB

  • Aster Data Database

  • Slide 12

  • Slide 13

  • SQL-MapReduce Function

  • SQL-MapReduce Function

  • Slide 16

  • Tham khảo

  • Slide 18

Tài liệu cùng người dùng

Tài liệu liên quan