Tìm hiểu kiến trúc dòng vi xử lý intel xenon 6000

20 460 0
Tìm hiểu kiến trúc dòng vi xử lý intel xenon 6000

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÁO CÁO TIỂU LUẬN KỸ THUẬT VI XỬ LÝ GIẢNG VIÊN : HOÀNG XUÂN DẬU Đề Tài: TÌM HIỂU KIẾN TRÚC DÒNG VI XỬ LÝ INTEL XENON 6000 Thành Viên : Lê anh Tuấn Nguyễn Đình Thịnh Nguyễn Xuân Tiến Vũ Thành Tuân Vũ Văn Thuẫn I.GIỚI THIỆU Các thương hiệu Xeon trì qua nhiều hệ vi xử lý x86 x86-64 , tên vi xử lý mô hình cũ thường thêm vào phần sau tên vi sử lý thông thường ( vi xử lý dành cho máy tính để bàn ) , Nhưng mô hình gần dùng Xeon theo tên riêng CPU thường có nhớ Cache cao nhiều so với vi xử lý khác có khả multiprocessing capabilities (đa xử lý ) Intel Xeon Processor 6000 thiết kế cho khối công việc nhớ hạn chế Intel Xeon Processor 6000 với máy chủ đa lõi 64-bit lựa chọn hợp lý Đặc Điểm : - Với core 16 threads cho Socket công nghệ Intel ® HyperThreading Technology Intel Xeon tăng hiệu xuất xử lý với việc sản xuất công nghệ 45nm hỗ trợ khoảng không cho ứng dụng đòi hỏi xử lý đa luồng - Với vi kiến trúc Nahalem cho phép thúc đẩy hiệu xuất nhớ cache nhiều ứng dụng , mô trường người sử dụng Cho phép triển khai liệu với mật độ cao - Bộ nhớ cache L3 18 MB làm tăng hiệu truyền liệu cache – to – core , tối đa hóa nhớ để xử lý băng thông - Intel QuickPath Interconnect (Intel QPI) cung cấp tốc độ cao (lên đễn 25,6 GB/s), point – to – point kết nối giữ vi xử lý , sử lý trung tâm I/O hub II.KIẾN TRÚC VI SỬ LÝ 1- Sơ Đồ Khối CPU Xeon 6000 dựa theo kiến trúc nehalem Sơ đồ khối khối thực thi:  FPU : Floating - Point Unit Khối chịu trách nhiệm cho việc thực thi cácbiểu thức toán học floating-point lệnh MMX SSE Trong CPU này, FPU không “hoàn thiện” số kiểu lệnh ( FPmov, FPadd Fpmul ) thực thi FPU : Fpadd : Chỉ có FPU xử lý lệnh cộng floatingpoint ADDPS o FPmul: Chỉ có FPU xử lý lệnh nhân floatingpoint MULPS o FPmov:Các lệnh cho việc nạp copy ghi FPU, MOVAPS (đượcdùng để truyền tải liệu đến ghi SSE 128-bit XMM) Kiểu chỉlệnh thực thi FPU, FPU thứhai thứ ba lệnh Fpadd hay Fpmul trongReservation Station FP ADD: thực thi lệnh SSE có tên gọi PFADD (Packed FP Add) lệnh COMPARE, SUBTRACT, MIN/MAX CONVERT Khối cung cấp riêng, bắt đầu việc thực thi lệnh giải mã chu kì clock dù không hoàn tất thực thi lệnh giải mã trước Khối có độ trễ chi kì clock, nghĩa giữ chậm chu kì clock đồi với lệnh xử lí AGU : lệnh liên quan đến số nguyên lên quan đến nhớ thực Store Data: Khối xử lý lệnh yêu cầu liệu ghi vào nhớ RAM o    – Đặc Điểm Phần Cứng Đặc điểm cache : Hệ thống cache Xeon 6000 tăng thêm mức cache L3 có dung lượng lớn (18MB) dùng chung cho tất nhân Mỗi nhân sở hữu riêng hai cache L1 (32KB) L2 (32KB, độ trễ thấp 12 chu kỳ có đường liên kết) Bộ nhớ đệm L3 vi xử lí xeon 6000 hoạt động với tần số độc lập có hệ thống cấp nguồn riêng biệt với nhân để đảm bảo độ ổn định giảm xác suất lỗi Ưu điểm thiết kế cache L3 giúp việc trao đổi liệu nhân hiệu mà không cần thông qua cache bên nhân Tuy nhiên, cache L3 có ảnh hưởng đến hoạt động cache riêng nhân Mỗi dòng lệnh cache L3 chứa bit đánh dấu nhân có chứa dòng lệnh cache riêng Cụ thể, nhân truy vấn L3 “thấy” bit đánh dấu mang giá trị “hiểu” cache riêng chưa có dòng lệnh đó, ngược lại, bit đánh dấu mang giá trị có khả cache riêng có dòng lệnh Hơn nữa, giao thức truy xuất liệu cache nhân có chuyển biến thành giao thức MESIF (Modified, Exclusive, Shared, Invalid and Forward) Sự phối hợp bit đánh dấu MESIF giúp giảm bớt tần suất truy cập cache nhân nên giải phóng nhiều băng thông cho liệu thật cần thiết cache Bộ phận điều khiển nhớ Bus Để tăng tốc độ giao tiếp với RAM VXL tích hợp chip điều khiển nhớ Chip điều khiển hỗ trợ cho nhớ hiệu cao DDR3, cho phép chạy chế độ nhớ kênh ba (triple channel) thay chạy kênh đôi Sau “loại bỏ” lượng băng thông dùng cho nhớ, tuyến bus sử dụng trước để BXL giao tiếp với chipset (giờ có tên Intel QuickPath Interconnect - Intel QPI) trở thành tuyến bus “độc quyền” cho công việc trao đổi BXL thiết bị khác hệ thống Intel QPI gồm hai tuyến truyền nhận liệu hoàn toàn riêng biệt với băng thông đường cao Tuy nhiên, việc mở rộng tuyến bus nói góp phần làm tăng số lượng chân (pin) giao tiếp BXL Do đó, việc sử dụng socket LGA775 với 775 chân không phù hợp Vì vậy, bo mạch chủ hỗ trợ BXL Nehalem trang bị socket FCLGA1567 Sau cấu hình Bộ vi xử lí Intel Xeon X6550 - AT80604001797AB:               Microarchitecture: Nehalem Platform: Boxboro-EX Core Stepping D0 (SLBRB) CPUID 206E6 (SLBRB) Công nghệ vi xử lí 45nm Băng thông liệu 64 bit Số nhân Cache mức o x 32 KB instruction caches o x 32 KB data caches Cache mức x 256 KB Cache mức 18MB Đa xử lí Lên đến vi xử lí Các tính o MMX intruction set o SSE o SSE2 o SSE3 o Suppelemental SSE3 o SSE4.1 o SSE4.2 o EM64T technology o Virtualization technology (VT-x and VT-d) o Execute Disable bit (giúp chống lại số virus mã độc) o RAS with machine check Architechture recovery (phát báo lỗi phần cứng ) o Hyper-Threading technology ( siêu phân luồng) o Turbo Boost Technology Tính tiết kiệm điện Enhanced SpeedStep technology Điều khiển thiết bị ngoại vi o o o điều khiển nhớ DDR3 SDRAM tích hợp với kênh đôi mở rộng giao tiếp nhớ điều khiển Quick Path Interconnect (4 tuyến) Giao tiếp PCI Express 2.0 III.KIẾN TRÚC TẬP LỆNH Tập lệnh Intel Xeon 6000 - iới iệ c n ề ậ ện - Mỗi xử lý có tập lệnh xác định - Tập lệnh thường có hàng chục đến hàng trăm lệnh - Mỗi lệnh chuỗi số nhị phân mà xử lý hiểu để thực thao tác xác định - Các lệnh mô tả b ng ký hiệu gợi nhớ lệnh hợp ngữ Cấu trúc tập lệnh chia làm nhóm với lệnh sau: ện ền ữ iệ - MOVE Copy liệu từ nguồn đến đích - LOAD Nạp liệu từ nhớ đến BXL - STORE Cất liệu từ xử lý đến nhớ - CLEAR Chuyển bit toán hạng đích Chuyển bit vào toán hạng đích - SET - INPUT Copy liệu từ cổng xác định đưa đến đích - OUTPUT Copy liệu từ nguồn đến cổng xác định ện - ADD ố c Cộng hai toán hạng - SUBTRACT Trừ hai toán hạng - MULTIPLY Nhân hai toán hạng - DIVIDE Chia hai toán hạng - ABSOLUTE Lấy trị tuyệt đối toán hạng c ện điề iển c ơn n - JUMP (BRANCH) Lệnh nhảy không điều kiện: nạp vào PC địa xác định - JUMP CONDITIONAL Lệnh nhảy có điều kiện: điều kiện nạp vào PC địa xác định ,điều kiện sai không làm - CALL Lệnh gọi chương trình - RETURN Lệnh trở từ chương trình c ện ic - AND Thực phép AND hai toán hạng - OR Thực phép OR hai toán hạng - XOR Thực phép XOR hai toán hạng - NOT Đảo bit toán hạng (lấy bù 1) c ện điề - HALT iển ệ ốn Dừng thực chương trình - WAIT Tạm dừng thực chương trình, lặp kiểm tra điều kiện thoả mãn tiếp tục thực - NO OPERATION - LOCK Không thực Cấm không cho xin chuyển nhượng bus - UNLOCK Cho phép xin chuyển nhượng bus c ện n - CMP So sánh byte hay từ - TEST Phép toán hạng để tạo cờ Xeon bắt đầu nghiệp lớp Pentium II Ngày nay, Intel xếp Xeon vào lớp Pentium III Cũng Pentium Pro, Xeon thiết kế dành cho server trạm làm việc trung cao cấp Các tập lệnh VXL MMX, SSE(1,2,3,3S,4.1,4.2), EM64T, VT-x Đây tập lệnh tích hợp vi xử lý Mỗi tập lệnh chịu trách nhiệm xử lý yếu tố chuyên biệt CPU hỗ trợ nhiều tập lệnh tốc độ xử lý lệnh nhanh ( độ xử lý nhanh ) Giới thiệu qua vài thuật ngữ: SIMD (Single Instruction, Multiple Data) SIMD mô tả phần mở rộng vi xử lý cho phép hoạt động liệu song song Một số phần mở rộng SIMD phổ biến là: MMX, 3DNow!, SSE, AltiVec (liên quan đến vmx) Có nhiều khác nữa, phổ biến tìm thấy máy tính thông thường Hầu hết SIMD sửa đổi chút trước triển khai thực Điều cho phép mở rộng chúng bao gồm MMX, MMX mở rộng, 3DNow!, 3DNow (đôi gọi 3DNow Professional 3DNow! +), SSE (còn gọi Katmai New instructions vắn tắt KNI), SSE2 (còn gọi Willamette New instructions đơn giản WNI), SSE3 (cũng gọi Prescott New instructions đơn giản PNI), tập lệnh SSE4 (còn gọi Tejas New instructions đơn giản TNI) MMX (Multimedia Extensions) –là tập lệnh mở rộng SIMD Intel phát triển 8086, tập lệnh bao gồm 57 lệnh multimedia Intel phát triển năm 1997 Công nghệ MMX bao gồm ghi từ MM0 đến MM7, tích hợp kiểu liệu kiểu bye kiểu word, kiểu doubleword quadword, tập lệnh MMX - Mục đích MMX nâng cao hiệu xử lý lệnh lặp âm thanh, hình ảnh đồ họa Máy đạt điều phần dòng lệnh đơn xử lý đồng thời số mục liệu MMX thiết kế sẵn dòng CPU Intel Tập lệnh MMX cho phép tác vụ thực đồng thời nhiều đơn vị liệu khác Các đối thủ cạnh Intel ( AMD, Cyrix, Centaur ) phát triển xử lý tương thích MMX họ (MMX-compliant chips) với lệnh riêng chuyên xử lý tác vụ tính tóan hình học dấu chấm động cần thiết di chuyển hình ảnh 3D ( Dimension - chiều ) hình Các lệnh MMX bao gồm nhóm lệnh sau: + Lệnh truyền liệu + Lệnh số học + Lệnh so sánh + Lệnh chuyển đổi + Lệnh logic MMX hỗ trợ khả tính toán số học gọi chế độ bão hòa số học Có nghĩa kết phép tính đặt phạm vi giới hạn giá trị tối đa giá trị tối thiểu Ví dụ với phép tính kết trả vượt giá trị kiểu bye khai báo ban đầu mặc định 127 với giá trị lớn 127 -128 với kết nhỏ 128 Xét tính toán không phù hợp cho lại có ứng dựng quan trọng xử lí lân cận ví dụ xử lí ảnh tính toán báo hòa làm vật giữ nguyên màu sắc trắng đen mà không cho phép đảo ngược SSE (Streaming SIMD Extension) SSE mở rộng SIMD cho vi xử lý Pentium III AMD AthlonXP Không giống MMX 3DNow! , chiếm không gian giống ghi FPU bình thường, mà SSE bổ sung thêm không gian riêng biệt để vi xử lý Bởi điều này, SSE sử dụng hệ điều hành hỗ trợ May mắn thay, hầu hết hệ điều hành gần xây dựng để hỗ trợ Tất phiên Windows kể từ Windows98 hỗ trợ SSE, hạt nhân Linux từ phiên 2.2 Một nhóm gồm 70 lệnh thiết kế thêm Bộ xử lý Pentium III nh m tăng cường chất lượng thực thi tác vụ đồ họa chiều (3D graphics) Nó hỗ trợ khả thực tính toán dấu chấm động hình học - tính cần thiết để hiển thị di chuyển hình ảnh chiều hình Đây tập hợp lệnh tăng cường thứ Intel nh m cải tiến khả đồ họa vi xử lý (tập hợp MMX) SSE gọi KNI ( Katmai New Instruction) tên mã trước CPU Intel Pentium III Katmai SSE có thêm ghi 128-bit, chia thành Các ghi gọi từ XMM0 - XMM7 Một ghi khiển bổ sung gọi MXCSR tồn hệ thống để kiểm tra tình trạng tập lệnh SSE MXCSR ghi 32-bit chứa cờ điều khiển thông tin liên quan đến lệnh SSE, bit từ – 15 xác định SSE Là tập lệnh hỗ trợ đồ họa mở rộng thiết kế cho Pentium Vi kiến trúc Netburst™ (Netburst™ Microarchitecture) mở rộng khả xử lý theo kiểu cấu trúc SIMD mà công nghệ Intel® MMX™ SSE b ng cách thêm vào 144 lệnh Các lệnh bao gồm tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) tác vụ dấu chấm động với độ xác gấp đôi SIMD 128-bit (128-bit SIMD double-precision floating-point operations) Các lệnh làm tối ưu hóa khả thực hịên ứng dụng phim video, xử lý âm - hình ảnh, mã hóa, tài chính, thiết kế nghiên cứu khoa học, kết nối mạng trực tuyến Cơ Netburst™: Là mô hình vi kiến trúc (micro architecture) Intel Nó cung cấp số tính công nghệ cao cấp như: công nghệ siêu ống (hyper-pipelined technology), kênh truyền hệ thống 400Mhz 533 Mhz (400Mhz - 533Mhz system bus), Bộ nhớ nội cho phép truy cập lệnh thực thi (Execution Trace Cache) Cơ chế thực thi lệnh nhanh chóng (Rapid Execution Engine) Một số công nghệ tính tăng cường như: Bộ nhớ nội truy cập nhanh cao cấp (Advanced Transfer Cache), Đơn vị xử lý dấu chấm động truyền thông đa phương tiện cải tiến (enhanced floating point and multimedia unit) Bộ lệnh hỗ trợ đồ họa truyền thông đa phương tiện cấp (Streaming SIMD SSE 2) Khả cung cấp số công nghệ tính tăng cường dựa vào tiến Intel lĩnh vực thiết kế mạch, xử lý việc tiêu thụ lượng công cụ tính toán thực mô hình vi kiến trúc hệ CPU trước ->SSE2 mở rộng tập lệnh MMX để hoạt động ghi XMM, cho phép người sử dụng hoàn toàn tránh khỏi việc ghi MMX 64-bit bị chồng ghi stack dấu chậm đọng thức IA-32 Điều cho phép trộn phần nguyên SIMD với cấu điểm vô hướng mà chế độ chuyển đổi MMX x87 Tuy nhiên, điều over-shadowed giá trị việc thực hoạt động MMX ghi SSE lớn Những bổ sung khác SSE2 bao gồm lệnh điều khiển nhớ cache nh m mục đích chủ yếu để giảm thiểu cache pollution xử lý dòng thông tin vô hạn định, bổ sung phức tạp lệnh chuyển đổi định dạng số SSE Đây tập lệnh bổ sung vào năm 2004 phiên thứ SSE đặt cho kiến trúc IA-32, SSE3 thêm vào 13 câu lệnh nh m giúp ứng dụng xử lý video game chạy nhanh hỗ trợ tăng tốc kết nối mạng, đa phương tiện Opcode list SSE Các xử lý Intel hệ hỗ trợ tập lệnh SSE4.1 bao gồm 47 tập lệnh Tuy nhiên, dù sở hữu lượng lớn tập lệnh mới, hầu hết số không kết hợp thành tập logic nào, mà thay vào lại bổ sung cho tập lệnh SIMD có sẵn Các tập lệnh thông thường gúp cải thiện hiệu suất hoạt động xử lý làm việc với dự án đồ họa 3D, truyền phát phim ứng dụng tính toán khoa học phức tạp Tuy vậy, sớm cảm nhận tác dụng tích cực việc hỗ trợ tập lệnh SSE4 trở nên phổ biến rộng rãi phần mềm máy tính Cho tới giờ, có hai ứng dụng sử dụng đến tập lệnh SSE4, giải mã video: DivX 6.7 TMPEG Xpress 4.4 Các đặc trưng tập lệnh SSE4 bao gồm tính toán nhân số nguyên 32-bit vector hóa; tính toán cực đại/cực tiểu 8-bit không dấu; phiên 16-bit 32-bit có dấu không dấu; tính giúp cải thiện khả trình biên dịch việc vector hóa số nguyên mã dạng single-precision hiệu hơn, bên cạnh chức tăng tốc mã hóa phim; tính toán tích vô hướng điểm trôi tập lệnh truyền tải sử dụng đặc thù kiến trúc nhớ đệm xử lý Một số lệnh SSE4: EM64T ( Extended Memory 64 Technology ) Intel đưa thị trường công nghệ 64 bit để cạnh tranh với công nghệ 64 bit AMD Công nghệ gọi EM64T (Extended Memory 64 Technology) , sử dụng Pentium 6xx , Pentium 5x1 ( 541,551,561 ) trêb Celeron D 3x1 3x6 ( 331 , 336,341,346 ) Bộ vi xử lí sử dụng công nghệ EM64T có kiểu hoạt động gọi IA32E mà lại có hai kiểu : Kiểu tương thích (Compatibility mode) cho phép hệ điều hành 64bit chạy phần mềm 32 bit 16 bit Hệ điều hành 64 bit chạy 64bit chương trình ứng dụng 32 bit , 16 bit lúc Đối với chương trình 32 bit CPU truy cập 4GB RAM Chương trình chạy 16 bit truy cập 1MB RAM Kiểu 64 bit ( 64-bit mode ) : cho phép hệ thống hoạt động 64 bit có nghĩa công nghệ dùng 64 bit địa Công nghệ EM64T sử dụng hệ điều hành 64 bit Windows64 , dùng hệ điều hành 32 bit Windows XP lúc chạy kiểu IA32 thông thường truy cập 32 bit địa - 4GB RAM Những đặc điểm kiểu 64-bit 64-bit địa có nghĩa ứng dụng sử dụng 16EB ( Exabytes ) nhớ (2^64) Trong vi xử lí Celeron D , Pentium Xeon hỗ trợ EM64T có 36 bit địa , có nghĩa sử dụng 65GB RAM ( 2^36) Xeon DP hỗ trợ EM64T có 40 đường địa tức truy cập nhớ 1TB ( 2^40) Giới hạn thay đổi tương lai , đáo tương lai Intel phát hành vi xử lí truy cập nhớ tới 16EB Thêm ghi : kiểu 64 bit , CPU có tất 16 ghi 64 bit Những ghi có tên R8 tới R15 R hiểu ghi 64 bit Hình bạn xem ghi 64 bit Thêm ghi sử dụng cho tập lệnh SIMD ( MMX, SSE, SSE2, SSE3 ) Trong kiểu EM64T vi xử lí có tất 16 ghi MMX 64 bit Thanh ghi XMM có độ dài 128 bit , số thành ghi XMM từ lên 16 ghi Những ghi XMM sử dụng phép tính dấu phảy động SSE Tất Register Pointer Instruction Pointercó độ rộng 64 bit Thanh ghi FPU có độ rộng 80 bit Tất ghi 64 bit chia thành ghi nhỏ bit hình Sơ đồ hình gọi “uniform byte-register addressing” Sử dụng kỹ thuật Fast interrupt-priorization Có Instruction Pointer liên quan tới EM64T gọi địa RIP-relative VT-x Đây tập lệnh mở rộng hiệu cần thiết phải có vi xử lý máy chủ, giúp chạy máy ảo 64bit phần mềm Vmware, VirtualBox ; dùng để chạy Windows server 2008 64bit Enable Hyper-V, chức quản lý máy ảo phần mềm Intel® VT cho phép hệ thống máy tính đơn lẻ hoạt động nhiều hệ thống máy tính “ảo” Đối với doanh nghiệp, Intel® VT cung cấp khả cải tiến công tác quản lý, hạn chế thời gian chết, trì nâng cao suất lao động b ng cách chia tách hoạt động riêng biệt thành khu vực hoàn toàn độc lập Kết Luận EM64T hướng tới hệ điều hành 64 bit , lúc muốn bạn mua Celeron D 64bit , Pentium 64 bit Nếu bạn có Celeron D 64 bit Pentium 64 bit , Windows 64 chương trình phần mềm 32 bit chạy tốt , chạy kiểu Compatibility Mode , có nghĩa bạn thấy vi xử lí Intel IA32 Nếu bạn sử dụng chương trình nặng nghĩa r ng phép tính 64 bit để có nhiều

Ngày đăng: 06/07/2016, 16:41

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan