BÀI TẬP LỚN MÔN KIẾN TRÚC MÁY TÍNH KIẾN TRÚC SONG SONG

42 1K 3
BÀI TẬP LỚN MÔN KIẾN TRÚC MÁY TÍNH  KIẾN TRÚC SONG SONG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

* BÀI BÁO CÁO KIẾN TRÚC MÁY TÍNH CHƯƠNG 18 KIẾN TRÚC SONG SONG Giảng viên hướng dẫn:ts Trần Hùng Bộ môn Khoa học máy tính * Nội dung chương 18 18.1 Phân loại kiến trúc máy tính 18.2 Một số kiến trúc song song thông dụng 18.4 Cụm 18.5 Bộ nhớ chính không đồng dạng * 18.1 Phân loại kiến trúc máy tính  Phân loại của Michael Flynn (1966) • • • • SISD – Single Instruction Stream, Single Data Stream (Cấu trúc đơn, dòng lưu chuyển dữ liệu đơn) SIMD - Single Instruction Stream, Multiple Data Stream (Cấu trúc đơn, nhiều dòng lưu chuyển dữ liệu) MISD – Multiple Instruction Stream, Single Data Stream (Cấu trúc đa lệnh, dòng lưu chuyển dữ liệu đơn) MIMD - Multiple Instruction, Multiple Data Stream (Cấu trúc đa lệnh, nhiều dòng lưu chuyển dữ liệu) * Sơ đồ tổ chức Processor Organization SISD SIMD MISD MIMD Uniprocessor Vector Processor Array Shared Memory (tighly couple) Distributed Memory (losesly coupled) Processor Symmetric Multiprocessor (SMP) Clusters Nonumiforn Memory Access (NUMA) * SISD CU IS PU DS • CU: Control Unit • PU: Processing Unit • MU: Memory Unit  Một bộ xử lý  Đơn dòng lệnh  Dữ liệu được lưu trữ trong bộ nhớ  Bộ xử lý Uni MU * SIMD CU IS PE1 DS LM1 PE2 DS LM2 DS LMn PEn PE (processing elements) LM (local memory) * SIMD (tiếp)     • • Đơn dòng lệnh điều khiển đồng thời các phần tử xử lý PE (processing elements) Mỗi phần tử xử lý có một bộ dữ liệu riêng LM (local memory) Mỗi lệnh được thực hiện các tập lệnh khác nhau Các mô hình SIMD Vector Computer Array processor * MISD     Một tập dữ liệu cùng được truyền đến một tập các bộ xử lý Mỗi bộ xử lý thực hiện một dãy lệnh khác nhau Không tồn tại máy tính thực tế Có thể có trong tương lai * Tightly coupled – SMP - NUMA SMP- Symmertric multiprocessor (đa đối xứng) • • • - Xử lý chia sẻ bộ nhớ Chia sẻ bộ nhớ xử lý Đa xử lý đối xứng Chia sẻ bộ nhớ đơn giản hay vùng nhớ Chia sẻ bus để truy cập bộ nhớ Tập trung bộ nhớ để khu vực nhất định của bộ nhớ là khoảng lành mạnh cho mỗi bộ vi xử lý NUMA- Nonuniform memory access(Truy cập bộ nhớ không đồng dạng) • Thời gian truy cập đến các vùng khác nhau của bộ nhớ có thể khác nhau * Tổng quan MIMD • • • Xử lý mục đích chung Mỗi người có thể xử lý tất cả các hướng dẫn cần thiết Tiếp tục phân loại theo phương pháp truyền thông xử lý * • • • • 18.4 Cụm (Cluter) Thay thế cho SMP Hiệu suất cao Tính sẵn sàng cao Ứng dụng máy chủ Thế nào là cụm? • 1 nhóm toàn bộ máy tính kết nói với nhau • Làm việc cùng nhau là nguồn tài nguyên thống nhất • Tưởng tượng toàn bộ là 1 máy • Mỗi máy được gọi là một nút * Lợi ích của cụm • • • • Khả năng mở rộng tuyệt đối Khả năng mở rộng gia tăng Tính sẵn sàng cao Giá superior/ hiệu suất * • Các vấn đề thiết kế hệ điều hành Quản lý thất bại - tính sẵn sàng cao - Nếu tai nạn máy chủ chính, do tính sẵn sàng cao, hệ điều hành chạy phần mềm chuyển đổi dự phòng sẽ sắp xếp lại nhiệm vụ của mình cho các máy chủ dự phòng +chuyển đổi các ứng dụng và dữ liệu từ hệ thống không thể thay thế trong cụm + Khôi phục lại các ứng dụng và dữ liệu của hệ thống ban đầu + Sau đó vấn đề được cố định * Các vấn đề thiết kế hệ điều hành (ti ế p) • Cân bằng tải - Khả năng mở rộng của hệ thống ban đầu gia tăng - Tự động kết nối các máy tính trong lịch - Có thể chuyển đổi giữa các máy * •   - Parallelizing Ứng dụng đơn thi hành song song bên một số máy ở trong cụm Dịch: Xác định tại thời gian biên dịch những phần có thể được thực hiện song song Tách ra cho các máy khác nhau Ứng dụng Ứng dụng được viết từ đầu là song song Truyền thông điệp để di chuyển dữ liệu giữa nút Khó khăn chương trình Kết quả cuối cùng tốt nhất *  - Parallelizing (tiếp) Tính toán tham số Nếu một vấn đề được thực hiện lặp đi lặp lại trên các thuật toán bộ nhớ khavs nhau của dữ liệu Xây dựng mô phỏng sử dụng bản khác nhau Cần công cụ hiệu quả để tổ chức và chạy * • • • • • • • • • • • • Phần mềm cụm trung gian Ảnh thống nhất cho người sử dụng Hệ thống hình ảnh duy nhất Điểm duy nhất của mục Hệ thống phân cấp tập tin đơn Điểm kiểm soát đơn Nối mạng ảo duy nhất Một không gian bộ nhớ Một hệ thống quản lý việc Giao diện một người dùng Một không gian I/O Không gian của một quy trình Dịch chuyển quy trình * • • • • - Cluster & SMP Cả hai cung cấp hỗ trợ bộ đa xử lý cho ứng dụng yêu cầu cao Cả hai sẵn có về mặt thương mại SMP lâu hơn SMP Dễ dàng quản lý và điều khiển Gần gũi hơn với các hệ thống xử lý đơn Lập kế hoạch khác Không gian vật lý ít Tiêu thụ điện năng thấp hơn Cluster: Khả năng nâng cấp tuyệt đối và gia tăng nhanh hơn Khởi động nhanh hơn 18.5 Bộ nhớ chính không đồng dạng (NUMA) • • • - Thay thế cho SMP và phân nhóm Truy cập tất cả các bộ nhớ Tất cả các bộ xử lý có thể truy cập tất cả các phần của bộ xử lý Sử dụng để tải và lưu trữ Cùng thời gian truy cập đến tất cả các vùng của bộ nhớ để xử lý khác nhau Sử dụng như SMP Truy cập bộ nhớ không đồng dạng Tất cả các bộ xử lý có thể truy cập tất cả các phần tử của bộ nhớ Sử dụng tải và lưu trữ Thời gian truy cập của bộ nhớ khác nhau tùy theo khu vực của bộ nhớ Xử lý khác nhau truy cập vào các khu vực khác nhau của bộ nhớ với tốc độ khác nhau 18.5 Bộ nhớ chính không đồng dạng (NUMA) • - Bộ nhớ cache Bộ nhớ cache được duy trì sự gắn kết giữa các cache của bộ vi xử lý khác nhau Đáng chú ý là cache khác nhau với SMP, cụm * Động lực (Motivation) • • • SMP có giới hạn thự tế có số bộ xử lý Lưu lượng bus giới hạn cho bộ xử lý từ 16 đến 64 Trong cụm mỗi bus có bộ nhớ riêng Các ứng dụng không thấy bộ nhớ toàn cầu lớn Gắn hết duy nất bằng phần mền không cần phần cứng NUMA vẫn giữ đặc tính SMP trong khi đưa ra quy mô lớn VD: Sillic đồ họa nguồn gốc NUMA 1024 MIPS R1000 bộ xử lý • Mục tiêu là để duy trì bộ nhớ ,mở rộng hệ thống trong khi cho phép nút bộ đọc xử lý với mỗi bus riêng hay hệ thống liên kết bên trong * Memory Access Sequence(trình tự truy cập bộ nhớ) • • - Mỗi nút duy trì vị trí của phần bộ nhớ trong thư mục và trình trạng của bộ nhớ cache VD: Nút 2 bộ xử lý 3 (P2-3) yêu cầu vị trí 789 là trong bộ nhớ của nút 1 Nút 2 bộ xử lý 3 (P2-3) được viết trên bus của nút 2 Thư mục trên nút 2 nhận vị trí là nút 1 Nút 2 thư mục yêu cầu thư mục của nút 1 Nút 1 thư mục yêu cầu nội dung của 789 Nút nhớ 1 đặt dữ liệu trên bus (nút 1 địa phương) Nút 1 thư mục được lấy dữ liệu trên bus Dữ liệu được chuyển vào thư mục của nút 2 Nút 2 thư mục được đặt dữ kiệu trên bus Dữ liệu chọn đặt trong P2 của bộ nhớ cache và chuyển đến bộ xử lý * Cache Cohrence (gắn kết bộ nhớ cache) • • • • Nút 1 được đặt giữa thư mục, nút 2 có bản sao dữ liệu Nếu dữ liệu được sửa đổi trong bộ nhớ cache thì điều này sẽ ảnh hưởng đến các nút khác Thư mục cục bộ giám sát các thay đổi dữ liệu lưu trữ từ xa và đánh dấu bộ nhớ không hợp lệ cho đến khi thoát Số thư mục cục bộ hết nếu vị trí bộ hớ theo yêu cầu của một bộ xử lý * • • • NUMAPROS CONS (Giám sát…) Hoạt động hiệu quả ở mức cao hơn song song với SMP Không có thay đổi phần mềm lớn Hiệu năng có thể phân tách nếu quá nhiều truy cập vào bbọ nhớ từ xa - Có thể tách do: + Thiết kế bộ nhớ đệm L2 & L1 giảm tất cả truy cập bộ nhớ + Cần làm tốt vùng tạm thời của phần mềm và vùng không gian của phần mềm + Quản lý bộ nhớ, trang ảo với các nút được sử dụng chúng hầu hết di chuyển • Không minh bạch: - Phân bộ trang, quá trình phân bố và cân bằng tải thay đổi cần thiết • Sẵn có The end… Thank you for watching…

Ngày đăng: 28/11/2016, 17:52

Từ khóa liên quan

Mục lục

  • Slide 1

  • Slide 2

  • Slide 3

  • Slide 4

  • Slide 5

  • Slide 6

  • Slide 7

  • Slide 8

  • Slide 9

  • Slide 10

  • Slide 11

  • Slide 12

  • Slide 13

  • Slide 14

  • Slide 15

  • Slide 16

  • Slide 17

  • Slide 18

  • Slide 19

  • Slide 20

Tài liệu cùng người dùng

Tài liệu liên quan