Tìm hiểu kiến trúc vi xử lý core i7 -990x

36 979 0
Tìm hiểu kiến trúc vi xử lý core i7 -990x

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tìm hiểu kiến trúc vi xử lý core i7 -990x

HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG BÁO CÁO VI XỬ CHỦ ĐỀ : NHÓM Tìm hiểu kiế n trúc VX L Core i7 -990X I Lời nói đầu Có thể nói công nghệ máy tính thay đổi hàng năm gần Đến thời điểm thật đáng kinh ngạc định luật tăng theo hàm mũ mật độ linh kiện chu vi điện tử đồng nghĩa với khả xử máy tính Cả thới chạy đua công nghệ, ngày xuất nhiều công ty sản xuất linh kiện máy tính Trong số không kể đến Intel - người khổng lồ lĩnh vực sản xuất thiết bị vi tính Công ty tỏ trội lĩnh vực sản xuất vi xử lí (CPU) máy tính, theo thống kê Intel chiếm 4/5 thị phần vi xử lí giới Được thành lập năm 1968 Santa Clara, California, Hoa Kỳ, sau năm Intel xuất thị trường dòng vi xử lí đầu tiên: 4004 với tốc độ108KHz với 23.000 bóng bán dẫn Cho đến Core i7 990X - vi xử lí nhanh hành tinh với nhân, tốc độ 3,46GHz, sử dụng công nghệ 32nm, đa nhân, siêu phân luồng… Intel thử nghiệm chuẩn bị cho hệ core i9 thời gian không xa… Chúng ta tìm hiểu kiến trúc vi xử intel core i7-990X qua II Giới thiệu chung VXL core i7 đời VXL core i7-990X  Giới thiệu chung VXL core i7 -Vào thời điểm đời (tháng 11-2008), Core i7 tên mã Bloomfield mệnh danh “CPU nhanh hành tinh”, với nhiều cải tiến công nghệ vượt trội so với hệ CPU từ Core trở trước - Core i7 đỉnh cao dòng vi xử hành Intel, gồm có cache nhớ lớn nhất, tốc độ clock nhanh cho mức hiệu suất thực cao nhất, với công nghệ vi xử tiên tiến nhất, gồm có ảo hóa phần cứng, hỗ trợ 64 -bit, tự động overclock theo yêu cầu, công nghệ 32nm 45nm… -Intel Core i7 sản xuất kiến trúc siêu vi Nehalem có thiết kế chip giống với hệ CPU Core i5 Lynnfield dùng cho hệ thống máy bàn truyền thống Chính ưu điểm tiết kiệm điện bật CPU Lynnfield Intel tận dụng phát triển vi xử Core i7 Tấm silicone Core i7 có diện tích bề mặt 296 mm2, chứa tới 774 triệu transitor với nhân (core) vật lý, mang công nghệ đột phá xử lý, tích hợp sẵn mạch điều khiển nhớ, sử dụng kiến trúc nhớ đệm cache cấp hỗ trợ công nghệ xử đa luồng Hyper-Threading  Sự đời VXL core i7-990X -Vào cuối năm 2010 Intel thức tung phiên (gần là) cuối dòng CPU Core i7 socket LGA 1366, model Core i7-990X Intel Core i7-990X phiên Extreme Edition với hệ số nhân không khóa, có nhân sản xuất tiến trình công nghệ 32nm Core i7-990X thay vương Core i7-980X, hãng xem xử có tốc độ nhanh má y tí nh đ ể b àn từ trước đến lên làm vua CPU desktop thời điểm -Bộ xử Core i7-990X có tốc độ xung nhịp 3,46GHz cao core i7-980x( tốc độ 3.33GHz ), thiết kế dành cho máy tính chơi gamevà tính p xung cho ph p người dùng đẩy tốc độ xung nhịp cao điều kiện định Tính chủ yếu dành cho game thủ hay chuyên viên đồ họa 3D hỗ trợ tối ưu giải trí đa phương tiện Bộ đệm thông minh chip lên đến 12 MB Chip trang bị tính Turbo Boost, tự động nâng xung từ 3.46 lên 3.6Ghz tùy vào mức độ tải công việc TDP 990X chiếm khoảng 130W toàn hệ thống.Theo trang tin BSN cho hay, khả p xung vi xử cao Chỉ với tản nhiệt khí, người dùng nâng lên ngưỡng 4.5Ghz cách dễ dàng đạt 5Ghz với hệ thống làm mát chất lỏng - Bộ vi xử Core i7-990X sản xuất dựa Gulftown công nghệ 32 nm cải tiến từ kiến trúc Nehalem 45 nanometer, công nghệ trình diễn lần với vi xử Core i7 nguyên thuỷ Dù cho công suất tiêu thụ điện thấp 95 vol 130 watt từ lần xuất đầu tiên, Core i7 sử dụng kiến trúc Nehalem trình diễn thuyết phục hầu hết ph p thử, cho thấy sức mạnh vượt trội so với tiền bối Core Kiến trúc Nehalem xây dựng công nghệ 45 nm, cho ph p Intel sản xuất chip từ đến lõi Tiêu chuẩn kỹ thuật Core i7 xây dựng kiến trúc hoàn toàn nên máy tính cần sử dụng bo mạch chủ Toàn tảng sử dụng Socket 1366 thay 775 Core i7 tương thích với chuẩn Chipset X58 nhớ RAM DDR3 Ki ến trúc vi xử Sơ đồ kiến tr úc thành phầ n c hính c VX L Inte l Core i7 990X Đặc điểm kiến trúc vi xử : X t bản, kiến trúc Gulftown đặc biệt Bloomfield kiến trúc Nehalem, có số nhân xử L3 cache tăng gấp 1,5 lần, cộng thêm với tập lệnh AES-NI giúp tăng cường khả mã hoá / giải mã thêm cho gia đình Core ix Tiến trình 32nm giúp Gulftown tương thích tốt với tảng “cũ” Bloomfield người dùng bận tâm sở hữu hệ thống socket LGA 1366 tay Các thành phần bao gồm : - nhân xử Mỗi nhân có 32KB L1 instruction cache ( thị ), 32KB L1 data cache (dữ liệu) 256KB L2 cache Ngoài tăng cường thêm 12MB L3 cache dùng chung nhân Một mạch điều khiển nhớ DDR3 Triple-Channel tích hợp ( IMC ) Mạch điều khiển bus QPI (QuickPath Interconnect) Bộ phận quản lí lượng tiêu thụ điện (PCU) đồng hồ Đồ họa tích hợp ( nằm bên với CPU, khuôn riêng) Mạch điều khiển nhớ tích hợp ( IMC ) Trong kiến trúc Nehalem, Intel tích hợp chip điều khiển nhớ xử (BXL) giúp tăng tốc độ giao tiếp với nhớ, băng thông giao tiếp BXL với thành phần khác hệ thống Cùng với việc tích hợp thêm chip vào BXL số chân giao tiếp BXL bo mạch chủ (BMC) nhiều trước Chip điều khiển nhớ bên BXL dòng hỗ trợ đến kênh (triple channel) thay hai kênh (dual channel) thông thường giúp nâng băng thông giao tiếp nhớ lên đến 25,6GB/s dung lượng RAM tối đa 24GB DDR3 Nhân thực thi ( Execution Core ) Sử dụng từ “Execution Core“ xác “Computing Core” không làm nhiệm vụ tính toán mà giải mã câu lệnh Ngoài ra, tất lệnh mã x58 lệnh tính toán Phần lớn thay đổi Core i7 so với Core miêu tả sau: “thêm vào số, mở rộng số khác.” Những cải tiến dễ giải thích: quy trình sản xuất tạo nhiều Transistor hơn, không cần phải tiết kiệm Transistor làm Còn tổng kết lại thay đổi có lợi nhất: Bộ phận mã hóa ( Decoder ) Thay đổi lớn phận giải mã có liên quan đến việc cải tiến công nghệ Macrofusion: hoạt động mode 32 bit, hỗ trợ tất mode CPU, có mode 64-bit Số lượng cặp lệnh mã hóa chu kỳ công nghệ tăng lên X t thuyết phận mã hóa Core i7 đạt hiệu suất (5 câu lệnh chu kỳ) nhiều lần so với Core Xử chu kỳ Loop Stream Detector, thiết kế để lưu lại chu kỳ ngắn thay tải lại chu kỳ từ nhớ Cache L1/L2, lần đầu xuất xử Core Trong Nehalem, phận hoạt động sau phận giải mã, có lệnh giải mã Ý tưởng xuât phát từ vi xử lí Pentium 4, Trace Cache Dự đoán rẽ nhánh ( Branch Prediction ) Phần nhánh tăng gấp đôi: chia làm phần, số có tốc độ dự báo nhánh cao (có thể copy lại phận dự báo Core 2), phần lại chậm hơn, có khả phân tích sâu sắc kèm theo Bộ đệm đủ lớn để dự đoán nhánh mà phần nhanh bỏ qua Intel hứa hẹn Return Stack Buffer(phụ trách địa trả chức năng) mở rộng lên Renamed RSBnhư Penryn Có điều trước phận nhầm lẫn thực thuật toán phức tạp, không Thực lệnh ( Instruction Execution ) Những phận phụ trách việc xử câu lệnh gần thay đổi so với Nehalem Do ta đưa kết luận đơn giản, không hiển nhiên rằng: trường hợp Core phải đối phó với việc câu lệnh liệu lấy trước ( Prefetch ) , giải mã dự báo nhánh, cải tiến nêu Core i7 không đem lại lợi nữa, Core i7 có khả xử Core Tuy nhiên có số cải tiến việc hỗ trợ Hyper-Threading dụ Reorder Buffer xếp lại mở rộng lên 128 vi lệnh, Reservation Station lên 36 lệnh (trước 32) Và đệm liệu: khả tải tăng từ 32 lên 48, khả lưu trữ từ 20 lên 32 đơn giản: để tăng số lượng câu lệnh liệu hàng thực thi, tăng khả thực thi chúng lúc Hệ thống Cache Cách làm nước đôi phổ biến Nehalem: kỹ sư không tăng gấp đôi Bộ phận nhánh ( Branch Unit )mà TLB (Translation-Lookaside Buffer)nữa Họ tiến hành hai việc theo cách: Bộ phận ( Unit ) thừa hưởng từ Core giữ nguyên (được mở rộng thêm chút), cấp độ thứ hai đưa vào TLB cũ – chí lớn (512 entry) có nhiều chức (TLB L2 dịch địa trang với kích thước ) Còn hỗ trợ trang có kích thước mà hay sử dụng vi xử dành cho máy tính để bàn tính kèm với ứng dụng máy chủ nặng Và TLB lớn rõ ràng bước tiến lên SMT Tuy nhiên, hầu hết thay đổi giới thiệu hệ thống Cache chính, cụ thể chức tương tác L1-L2 cache L3 thêm vào Nehalem Đầu tiên, L2 thuộc nhân định không chia sẻ Còn L3 chia sẻ tất nhân Thứ hai, Intel điều chỉnh chút thời gian trễ L1, độ trễ L2 L1 cao chu kỳ so với Core 2, thời gian trễ L2 thấp đến 1.5 lần Nhưng chủ yếu quan tâm đến L3 Cũng L2 Core 2, Cache chia sẻ động Hơn nữa, mang tính bao quát : liệu L1/L2 phải xuất L3 Mỗi dòng Cache L3 chứa bit hợp lệ nhân ( dựa theo số nhân vật lý), chúng biểu việc liệu L1/L2 gốc chứa nhân không cần phải dò tìm nhân Intel có ý tưởng tương tự cấu trúc Cache tối ưu: tốc độ quan trọng dung lượng Việc liên quan đến thực tế họ có nhiều lợi việc thiết kế Cache với dung lượng lớn công nghệ chế tạo Transistor 32nm Tuy nhiên thất vọng chút việc Cache L3 Core i7 không hoạt động theo tốc độ xung nhịp vi xử lý, mà theo tốc độ cố định Giao thức truy xuất liệu cache nhân có chuyển biến thành giao thức MESIF (Modified, Exclusive, Shared, Invalid and Forward) giúp giảm bớt tần suất truy cập cache nhân để nâng cao hiệu tính toán song song QPI thay cho QPB Tiêu đề nghe lạ tai thực lại phù hợp: QPIchữ viết tắt Bus vi xử Intel (QuickPath Interconnect)chỉ khác với Bus cũ QPB (Quad Pumped Bus)một chữ hay gọi FSB Vậy QPI gì? Về mặt kỹ thuật Bus 20-bit chiều với phương thức truyền liệu từ điểm-tới-điểm ( Point-to-Point ), mỗi hướng mang liệu 16-bit, bit lại dùng cho việc sửa lỗi giao thức Với khả xử 6.4 tỉ giao dịch giây, QPI có tốc độ trao đổi liệu lên 12.8 GB/giây theo hướng, tổng cộng 25.6 GB/giây Bus xử nhanh (1600-MHz QPB có tổng băng thông 12.8 GB/giây, AMD HyperTransport 3.0 24 GB/giây) Tuy nhiên, phiên QPI nhanh dành cho Core i7 Extreme Edition Còn xử Core i7 bình thường chậm chút với băng thông 4.8 tỉ giao dịch chu kỳ là: lượng băng thông dùng hầu hết thời gian sử dụng vi xử để bàn, Bus QPI dùng để kết nối với Chipset mà , mạch điều khiển nhớ tích hợp vào xử (Giải pháp hữu ích chipset cung cấp thật nhiều đường truyền PCI Express 2.0, giống chipset Intel X58 dành cho Nehalem.) 10 5.2 Floating-Point Dot Product Instructions - ( Các lệnh xử giá trị thực) DPPD: Biểu diễn giá trị thực với độ xác k p cho tối đa elements sử dụng giá trị (broadcast) DPPS: Biểu diễn giá trị thực với độ xác đơn cho tối đa elements sử dụng giá trị (broadcast) 5.3 Streaming Load Hint Instruction (Lệnh điều khiển nạp theo tiến trình dòng chảy) Trong lịch sử, CPU đọc liệu vùng WC memory (Write-Combining memory) với thông lượng chậm đáng kể so với truy cập vào cacheable memory Write combining (WC) công nghệ bus máy tính cho ph p liệu kết hợp lưu trữ tạm thời đệm (buffer) – the write combine buffer (WCB) Rồi sau đó, liệu giải phóng lúc thay ghi bit đoạn bit đơn lẻ MOVNTDQA : gọi dòng lệnh “Streming Load” SSE4.1, cung cấp lời gợi ý không phụ thuộc thời gian, cho ph p lấy 16-byte liền kề phạm vi 64-byte thẳng hàng thuộc kiểu nhớ WC (“a streaming line”) để nạp giữ lại khu vực nhỏ đệm tạm thời (“streaming load buffers”) Sau đó, “dòng chảy” tiếp tục nạp tiếp nhóm 16-byte khác “streaming line” Việc phù hợp với “streaming load buffer” giúp cải thiện thông lượng CPU 5.4 Packed Blending Instructions (Các lệnh trộn kiểu packed) - - SSE4.1 thêm vào lệnh sử dụng cho thao tác trộn liệu (BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDW) Tùy theo điều kiện, trình trộn ch p thành phần liệu toán hạng nguồn vào thành phần giống toán hạng đích Tập lệnh SSE4.1 nâng cấp toán tử trộn cho hầu hết kích thước trường liệu Một lệnh đơn SSE4.1 thông thường thay cho chuỗi tới trình hoạt động sử dụng công nghệ trước Có hai phương thức trộn (Blend control): + imm8 (điều khiển byte trực tiếp) + XMM0 (sử dụng lọc – implied mask) 22 Instructions Packed Packed Packed Packed Packed Packed Blend Double Single QWord DWord Word Byte Control FP FP BLENDPS X BLENDPD Imm8 X BLENDVPS Imm8 X BLENDVPD X X X PBLENDVB XMM0 (1) XMM0 (2) PBLENDW (1) X (2) X (2) X X XMM0 Imm8 TABLE1 Blend Field Size and Control Modes Supported by SSE4.1 NOTE: Việc sử dụng lệnh dấu chấm động SIMD kiểu liệu Integer phải gánh chịu bất lợi mặt hiệu Việc trộn lẫn biến số theo byte sử dụng cho trường có kích thước lớn cách định dạng lại (hoặc xếp lại) trình điều khiển trộn 5.5 Packed Integer MIN/MAX Instructions - (Các lệnh MIN/MAX với nhóm số nguyên) SSE4.1 thêm vào lệnh MIN MAX cho nhóm số nguyên (PMINUW, PMINUD, PMINSB, PMINSD; PMAXUW, PMAXUD, PMAXSB, PMAXSD) Bốn lệnh MIN MAX hoạt động Dword có dấu không dấu Hai lệnh hoạt động Word không dấu Integer Width Integer Format Byte Word Dword Unsigned PMINUB* PMAXUB* PMINUW PMAXUW PMINUD PMAXUD Signed PMINSB PMAXSB PMINSW* PMAXSW* PMINSD PMAXSD TABLE2.Enhanced SIMD Integer MIN/MAX Instructions Supported bySSE4.1 NOTE: * có giá trị ưu tiên cho SSE4.1 23 5.6 Floating-Point Round Instructions with Selectable Rounding Mode - (Các lệnh làm tròn số thực với cách thức làm tròn tùy chọn) ROUNDPS: Làm tròn giá trị thực độ xác đơn thành giá trị nguyên trả lại giá trị thực làm tròn ROUNDPD: Làm tròn giá trị thực độ xác k p thành giá trị nguyên trả lại giá trị thực làm tròn ROUNDSS: Làm tròn giá trị thực độ xác đơn mức thấp thành giá trị nguyên trả lại giá trị thực làm tròn ROUNDSD: Làm tròn giá trị thực độ xác k p mức thấp thành giá trị nguyên trả lại giá trị thực làm tròn 5.7 Insertion and Extractions from XMM Registers - - (Chèn rút từ ghi XMM) EXTRACTPS: Rút giá trị thực độ xác đơn từ khoảng không gian định ghi XMM lưu kết vào nhớ vào ghi tổng quát INSERTPS: Chèn giá trị thực độ xác đơn từ vị trí nhớ 32-bit từ không gian định ghi XMM vào không gian định ghi XMM đích Thêm vào đó, INSERTPS cho ph p tập trung vào thành phần liệu ghi đích, sử dụng lọc PINSRB: Chèn byte giá trị từ ghi nhớ vào ghi XMM PINSRD: Chèn giá trị Dword từ ghi 32-bit nhớ vào ghi XMM PINSRQ: Chèn giá trị Qword từ ghi 64-bit nhớ vào ghi XMM PEXTRB: Rút byte từ ghi XMM chèn giá trị vào ghi tổng quát nhớ PEXTRW: Rút Word từ ghi XMM chèn giá trị vào ghi tổng quát nhớ 5.8 Packed Integer Format Conversions - - (Quá trình chuyển đổi định dạng số nguyên – kiểu packed) Kiểu dạng chung toán tử nhóm số nguyên trình chuyển đổi phương thức zero sign-extension từ nhóm số nguyên sang loại liệu rộng SSE4.1 thêm vào 12 lệnh giúp chuyển đổi từ dạng số nguyên kích thước nhỏ sang dạng số nguyên kích thước lớn (PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXWD, PMOVZXWD, PMOVSXBQ, PMOVZXBQ, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ) Toán từ nguồn lấy từ ghi XMM nhớ; toán tử đích nằm ghi XMM 24 Source Type Destination Type Byte Word Dword Sign Word Unsign Word PMOVSXBW PMOVZXBW Sign Dword Unsign Dword PMOVSXBD PMOVZXBD PMOVSXWD PMOVZXWD Sign Qword Unsign Qword PMOVSXBQ PMOVZXBQ PMOVSXWQ PMOVSXDQ PMOVZXWQ PMOVZXDQ TABLE New SIMD Integer conversions supported by SSE4.1 5.9 Improve Sums of Absolute Differences (SAD) for 4-Byte Block (Cải tiến khả tính tổng giá trị tuyệt đối hiệu cho khối 4-byte) SSE4.1 thêm vào lệnh (MPSADBW) cho ph p biểu diễn trình SAD (4-byte chiều rộng) câu lệnh để đưa giá trị kết So sánh với PSADBW, MPSADBW hoạt động khối liệu nhỏ (4-byte thay khối 8-byte) Điều làm cho câu lệnh tương thích tốt với chuẩn mã hóa video VC.1 H.264 Horizontal Search (Tìm kiếm theo phƣơng ngang) SSE4.1 thêm vào lệnh tìm kiếm (PHMINPOSUW) tìm giá trị vị trí “minium unsigned word” từ nhóm word không dấu xếp ngang Kết đưa - giá trị trí (không gian phạm vi nguồn) - gói gọn vào Dword mức thấp ghi đích XMM 5.10 Packed Test (Kiểm tra liệu – kiểu packed) Lệnh “Pack Test - PTEST” có kế thừa tới 128-bit lệnh TEST Với PTEST, đối số nguồn sử dụng điển lọc theo bit 5.11 Packed Qword Equality Comparisons (So sánh đẳng thức Qword - packed) SSE4.1 thêm vào 128-bit kiểm tra đẳng thức Qword Lệnh (PCMPEQQ) đồng với PCMPEQD, lệnh làm việc với Qword PCMPEQD hỗ trợ Dword 5.12 Dword Packing With Unsigned Saturation (Nén Dword với bão hòa không dấu) SSE4.1 thêm vào lệnh (PACKUSDW) để hoàn tất tập lệnh n n số nguyên nhỏ họ mở rộng lệnh SIMD PACKUSDW n n Dword trở thành Word với bão hòa không dấu Xem bảng nói tập lệnh n n cho số nguyên nhỏ (small intergers) 5.13 25 Saturation Type Pack Type Dword -> Word Word -> Byte Unsigned PACKUSDW (new!) PACKUSWB Signed PACKSSDW PACKSSWB TABLE4 Enhanced SIMD Pack support by SSE4.1 SSE4.2 INSTRUCTION SET số lệnh SSE4.2 sử dụng ghi XMM làm nguồn đích Nó gồm có: + lệnh xử văn /chuỗi lệnh word so sánh số nguyên SIMD (theo kiểu packed) + lệnh lại sử dụng ghi tổng quát để biểu diễn hàm xử Nhanh Tập lệnh bao gồm nhóm 6.1 String and Text Processing Instructions (Các lệnh xử xâu văn bản) - PCMPESTRI: So sánh xâu có chiều dài hiện, trả lại số vào ECX/CRX PCMPESTRM: So sánh xâu có chiều dài hiện, trả lại giá trị lọc vào XMM0 - PCMPISTRI: So sánh xâu có chiều dài ẩn, trả lại số vào ECX/CRX PCMPISTRM: So sánh xâu chiều dài ẩn, trả lại giá trị lọc vào XMM0 6.2 Packed Comparison SIMD integer Instruction(Lệnh so sánh số nguyên SIMD theo kiểu packed) PCMPGTQ: Biểu diễn so sánh logic số nguyên quadword (kiểu packed) 6.3 Application-Targeted Accelerator Instructions - CRC32: yêu cầu gia tốc phần cứng để tính toán nhanh dư thừa bổ sung có hiệu giao thức toàn vẹn liệu POPCNT: Lệnh tính toán số bit đặt toán hạng thứ (của toán hạng nguồn) trả lại giá trị tính vào toán hạng (thanh ghi đích) AES Instructions Tập lệnh AES (Advanced Encryption Standard) mở rộng kiến trúc tập lệnh x86 dành cho vi xử lý, Intel AMD tạo dựng (được đề xuất Intel vào tháng năm 2008) Mục đích tập lệnh giúp cải thiện tốc độ ứng dụng thực mã hóa giải mã Tập lệnh AES gồm có lệnh thành phần 26 - lệnh đầu, cụ thể AESENC, AESENCLAST, AESDEC, AESDECLAST, cung cấp cho việc mã hóa giải mã liệu Các lệnh có dạng register-register register-memory lệnh khác, cụ thể AESIMC AESKEYGENASSIST, cung cấp để trợ giúp với AES Key Expansion AESENC (AES Encrypt Round): Biểu diễn vòng dòng mã hóa AES AESENCLAST (AES Encrypt Last Round): Biểu diễn vòng cuối dòng mã hóa AES AESDEC (AES Decrypt Round): Biểu diễn vòng dòng giải mã AES AESDECLAST (AES Decrypt Last Round): Biểu diễn vòng cuối dòng giải mã AES - AESKEYGENASSIST (AES Key Generation Assist): Assist in AES round key generation AESIMC (AES Inverse Mix Columns): Assist in AES Inverse Mix Columns Đặ c tính công nghệ 1.Công nghệ 32nm Đầu tiên phải kể đến VXL core i7990X VXL sử dụng công nghệ 32nm kiến trúc Gulftown giúp thêm nhân 4MB L3 cache, mà có đế nhỏ người tiền nhiệm: 248 mm vuông so với kích thước 263 mm vuông Bloomfield Số transistor (bán dẫn) từ tăng từ 731 triệu lên 1,17 tỉ Rất ấn tượng biết Core i7-990X có điện tiêu thụ 130W giống xử i7-9xx nhân dòng Bloomfield 2.Bộ nhớ đệm L3 Cache Hệ thống nhớ đệm (cache) BXL có chút thay đổi với việc tăng cường thêm mức cache L3 dùng chung (L1, L2 riêng nhân) thay có mức cache L1 riêng nhân L2 dùng chung Core Ưu điểm thiết kế giúp việc trao đổi liệu nhân hiệu mà không cần thông qua cache bên nhân Giao thức truy xuất liệu cache nhân có chuyển biến thành giao thức MESIF (Modified, Exclusive, Shared, Invalid and Forward) giúp giảm bớt tần suất truy cập cache nhân để nâng cao hiệu tính toán song song 27 3.Trang bị công nghệ Turbo Boost Ngoài ra, Intel tích hợp chip điều khiển lượng PCU (Power Control Unit) để thực công nghệ Turbo Boost, giúp tự động chuyển lượng dư thừa từ nhân “rảnh rỗi” sang nhân cần tải công việc lớn nhân hoạt động mức xung nhịp cao mặc định nhằm tăng hiệu đồng thời tiết kiệm điện Như vậy, Turbo Boost công nghệ nâng hiệu suất máy tính lên thêm 20%, giúp hệ thống hoạt động nhanh k o dài thời lượng pin, cách tự động điều chỉnh xung nhịp nhân độc lập cho phù hợp với nhu cầu xử - Đây xem công nghệ overclock tự động Intel, tăng tốc độ tính toán xử lí đồ họa cần thiết, tùy thuộc vào yêu cầu ứng dụng Về nguyên tắc, công suất tối đa CPU tổng công suất xử đồ họa tính toán, quy định nhà sản xuất, thông thường ứng dụng không đòi hỏi yêu cầu đồ họa yêu cầu tính toán lúc, nên với công nghệ Turbo Boost, CPU lấy phần công suất (tạm gọi thế) bên sử dụng sang tập trung tăng tốc cho bên kia; dụ với ứng dụng yêu cầu tính toán nhiều mà yêu cầu đồ họa CPU tự động tập trung công suất xử tính toán cách tăng tần số tăng điện áp để tăng tốc độ; ngược lại với ứng dụng đồ họa cao, Turbo Boost kết hợp với chức Dynamic Frequency (tần số linh động) dồn công suất sang giúp cho tần số xử đồ họa cải tiến Như CPU chạy nhanh mức nhà sản xuất đặt phương diện tính toán phương diện đồ họa mà công suất không thay đổi, CPU không bị nóng Bên cạnh đó, mạch điều khiển nhớ tích hợp (integrated memory controller) Intel đưa vào chip, giúp việc trao đổi liệu nhân điện toán nhớ nhanh so với thành tố nằm tách biệt bảng mạch Công nghệ Turbo boost tự động điều chỉnh xung nhịp nhân độc lập cho phù hợp với nhu cầu xử Công nghệ nâng cao hiệu suất cho xử Đồng thời giúp k o dài thời gian sử dụng pin cách giảm xung nhịp CPU chạy ứng dụng không cần nhiều tính toán CPU 28 Turbo Boost điều khiển hoàn toàn tự động bios máy tính chipset bo mạch chủ nói an toàn tuyệt đối CPU tự động thay đổi xung nhịp tùy theo tải, làm việc nặng tự nâng xung nhịp lên ngược lại, hạ xuống thấp trạng thái nghỉ Thí dụ Core i7 720QM có tốc độ mặc định 1,6GHz nhiên cần tự nâng lên tối đa đến 2,8GHz, mức 1,2GHz trạng thái nghỉ Việc điều khiển tốc độ CPU máy tính định hoàn toàn, người dùng theo dõi xung hoạt động thông qua Gadgets dành cho Windows Vista/Windows 4.HyperThreading trở lại HyperThreading (HT) khái niệm Intel giới thiệu thời kỳ Pentium Công nghệ giới thiệu thị trường đạt thành công vang dội khía cạnh… marketing Công nghệ HyperThreading áp dụng Pentium làm nhiều người dùng thỏa mãn với biểu đồ hoạt động CPU lên cửa sổ Task Manager Trong với thử nghiệm thực tế, bật tính lên làm cho CPU xử k m hiệu vài công việc Tất nhiên, HT làm cho vài ứng dụng nhanh ứng dụng yêu cầu CPU làm việc theo cách mà HT phát huy khả Thành thực mà nói vậy, nhìn chung, việc hy vọng vào HT để tăng tốc độ xử CPU phần nhiều là… hên xui Và HyperThreading nói lời chia tay với người dùng Core đời gây hiệu nghèo nàn HyperThreading nằm chất HyperThreading, mà nằm kiến trúc Pentium 4, không phù hợp cho Hyper Threading trổ tài 29 Về chất, nhân xử xử hai luồng thông tin vào thời điểm Nếu muốn lúc có nhiều ứng dụng (hay thực chất nhiều process con, nhiều thread) chạy song song, hệ điều hành phải lệnh cho nhân xử liên tục chuyển qua chuyển lại tác vụ xử cho thread Quá trình diễn rất-rất nhanh hoàn toàn nhận biết mắt thường, tạo cảm giác CPU xử tất khối lượng công việc song song thời điểm Minh họa cho cách SMT (Hyper Threading) làm tăng hiệu xử CPU HyperThreading tên Intel đặt cho công nghệ SMT (Simultaneous Multi-Threading) Công nghệ cho ph p nhân xử thực xử song song thread ứng dụng tạo ra, cách trang bị thêm số thành phần nhân xử lý, khiến hệ điều hành nghĩ làm việc với nhiều nhân xử lý, cung cấp khả đáp ứng cao hiệu suất vượt trội, đồng thời công nghệ cho ph p cân mức tiêu thụ lượng trình hoạt động Như vậy, với hệ điều hành tương thích xử nhiều nhân hay nhiều xử lý, xếp để nhiều thread gửi đến xử “ảo” Về mặt thuyết, có nhân xử xử song song thread tăng tốc độ xử chúng lên Tuy nhiên thực tế, lúc thành phần nhân xử sử dụng đến, thành phần không sử dụng đến dùng để xử thread thứ hai (hoặc thứ ba, thứ tư…) Công nghệ SMT giúp xử làm việc hiệu cách giảm bớt số lần nhân xử phải chuyển qua chuyển lại thread „‟song song” Quá trình chuyển này, nói trên, diễn nhanh liên tục, nghĩa không thời gian, việc giảm bớt lượng công việc này, xử rảnh rang để tập trung vào chuyên môn Intel EM64T: công nghệ cho ph p ứng dụng 64-bits chạy hệ điều hành 64-bits sử dụng hệ thống địa 64-bits nhớ, nói cách khác sử dụng nhiều nhớ nhằm tăng cường tốc độ xử Công nghệ kích hoạt hệ điều hành 64-bits Những CPU hỗ trợ công nghệ có thêm cách thức hoạt động gọi IA32E, gồm phương thức: 30 - Compatibility mode: cho ph p hệ điều hành 64-bits chạy ứng dụng 32-bits 16-bits bình thường, song song với ứng dụng 64-bits Tuy nhiên ứng dụng 32-bits chạy múc tương tự chúng chạy CPU 32-bits, với lượng nhớ try cập tối đa 4GB Tương tự với ứng dụng 16-bits với mức truy nhập nhớ tối đa 1MB - 64-bit mode: dành cho ứng dụng 64-bits, cho ph p hệ điều hành 64-bits cung cấp hệ thống địa nhớ 64-bits Các công nghệ bật - 1.Enhanced Intel SpeedStep Technology(EIST) : Là công nghệ phổ biến Intel Giúp VXL chạy với tốc độ phù hợp thời điểm khác tùy trạng thái ứng dụng chạy Công nghệ cho hiệu suất thực cao đáp ứng nhu cầu tiết kiệm điện -Sử dụng điện cách hợp theo thời điểm phụ thuộc vào trạng thái số lượng ứng dụng Điều rõ ràng giúp tiết kiệm lượng -Cách thức chuyển qua lại trình xử nhanh nhờ có bus clock tiếp tục chạy trình chuyển đổi trạng thái, chí core-clock Phase-Locked Loop ( thiết bị tạo xung nhịp) dừng, cho ph p trạng thái logic vi xử tiếp tục hoạt động Core-clock khởi động lại nhanh sử dụng công nghệ EIST Công nghệ EIST thay đổi FSB thay đổi vCore CPU thông qua việc điều chỉnh BIOS phần mềm ( OS ) EIST không giảm Multiplier mà giảm FSB, EIST trải qua nhiều version khác nhau, từ V1.1 đến V3.2 Trước đây, với V2.2 vi xử Pentium 4-Mobile EIST thay đổi Multiplier version sau EIST có tác dụng thay đổi FSB mà không thay đổi Multiplier ( nhường công việc thay đổi Multiplier cho C1E ) 2.Công nghệ Virtualization Technology (VT-x) : Hỗ trợ ảo hóa phần cứng yêu cầu từ chương trình ảo hóa Windows Vitual PC Cho ph p hiệu suất máy ảo nhanh hơn, chạy trơn tru hơn, tăng luồng liệu giảm tiêu tốn tài nguyên hệ thống Hỗ trợ HDH ứng dụng 64 bit Về mặt kĩ thuật, ảo hóa tách biệt người sử dụng ứng dụng đặc tính phần cứng chuyên biệt hệ thống mà họ sử dụng để thực công việc máy tính Công nghệ hứa hẹn mở sóng cách mạng phần cứng phần mềm hoàn toàn dụ ích lợi ảo hóa đơn giản hóa trình nâng cấp hệ thống (trong số trường hợp, không cần nâng cấp hệ thống), việc cho ph p người sử dụng nắm bắt trạng thái máy ảo (VM), sau chuyển trạng thái tình trạng nguyên vẹn từ hệ thống cũ sang hệ thống Ngoài ra, ảo hóa hứa hẹn tạo khả điện toán với hiệu cao Số lượng thực xử lý, nhớ, nguồn lưu trữ… cần có cho hệ thống ngày điều chỉnh định tính tính toán ảo hóa 31 Execute Disable technology Là tính bảo vệ phần cứng giảm tiếp xúc với virus mã độc hại-tấn công ngăn chặn phần mềm độc hại từ máy chủ mạng Internet Trợ giúp bảo vệ tài sản kinh doanh khách hàng giảm bớt cần thiết phải sửa chữa tốn k m liên quan đến vi rút cách xây dựng hệ thống có tích hợp Intel Execute Disable Bit giúp tăng cường không gian hoạt động Chuẩn mã hóa AES-NI Một bổ sung khác đáng ý AES-NI - chuẩn mã hóa nâng cao dựa phần cứng Intel Xuất trước xử Clarkdale Core i5 chưa có trình diễn ấn tượng cho lắm, tiến lên Core i7-980X, AES-NI phần khẳng định giá trị tiềm Đương nhiên -990X thừa hưởng điều Cụ thể AES vốn giao thức mã hóa phổ biến sử dụng nhiều ứng dụng Intel, vốn kẻ đầu việc bổ sung tập lệnh hỗ trợ việc tính toán mã hóa tốt hơn, bổ sung tập lệnh AES-NI vào sản phẩm Clarkdale Gulftown lần mắt với thị bổ sung Theo mô tả , tốc độ tính toán mã hóa CPU có tập lệnh nhanh gấp nhiều lần, chí hàng chục lần với phần mềm hỗ trợ AES nay: n n giải n n, mã hóa ổ cứng, thu phát Wi-Fi, trò chuyện VoIP…… 32 KẾT LUẬN I Đá nh gi chung  Core i7 990X - vi xử lí nhanh hành tinh với nhân, tốc độ 3,46GHz, sử dụng công nghệ 32 nm, đa nhân, siêu phân luồng  Core i7 với nhiều cải tiến công nghệ vượt trội so với hệ CPU từ Core trở trước  Core i7 đỉnh cao dòng vi xử hành Intel, gồm có cache nhớ lớn nhất, tốc độ clock nhanh cho mức hiệu suất thực cao nhất, với công nghệ vi xử tiên tiến nhất, gồm có ảo hóa phần cứng, hỗ trợ 64 -bit, tự động overclock theo yêu cầu, công nghệ 32nm 45nm… Bộ vi xử Core i7-990X sản xuất dựa Gulftown công nghệ 32 nm cải tiến từ kiến trúc Nehalem 45 nanometer, công nghệ trình diễn lần với vi xử Core i7 nguyên thuỷ  Core i7 sử dụng nhiều công nghệ : công nghệ 32nm, Bộ nhớ đệm L3 Cache, Trang bị công nghệ Turbo Boost, HyperThreading, Intel EM64T  số công nghệ core i7 bật : Enhanced Intel SpeedStep Technology(EIST), Công nghệ Virtualization Technology (VT-x), Execute Disable technology   VXL core i7990X VXL sử dụng công nghệ 32nm kiến trúc Gulftown giúp thêm nhân 4MB L3 cache, mà có đế nhỏ người tiền nhiệm: 248 mm vuông so với kích thước 263 mm vuông Bloomfield Số transistor (bán dẫn) từ tăng từ 731 triệu lên 1,17 tỉ Rất ấn tượng biết Core i7-990X có điện tiêu thụ 130W giống xử i7-9xx nhân dòng Bloomfield  Intel tích hợp chip điều khiển lượng PCU (Power Control Unit) để thực công nghệ Turbo Boost, giúp tự động chuyển lượng dư thừa từ nhân “rảnh rỗi” sang nhân cần tải công việc lớn nhân hoạt động mức xung nhịp cao mặc định nhằm tăng hiệu đồng thời tiết kiệm điện 33 I I So sá nh – Đá nh gi Mặc dù core i7 990x ông vua vi xử nhiều vi xử khác có sức cạnh tranh lơn nhiều, điển hình vi xử core i7 3960x Core i7 3690x nhanh core i7 990x khoảng 47% Một số slide vừa tiết lộ DonanimHaber cho thấy kết thử nghiệm Intel model Sandy Bridge-E socket LGA2011 cao cấp khả quan Đối thủ i7-3960X Extreme Edition Intel lựa chọn “đại ca” model socket LGA1366: Core i7-990X Extreme Edition Khi quái thú cách hệ đối đầu trực diện, kết đoán ra, vấn đề mà 34 Cả model vi xử dòng siêu cao cấp sở hữu nhân, 12 luồng xử lý, nhiên i7-990X có xung 3.46GHz đệm 12MB, i7-3960X có xung 3.3GHz đệm L3 đến 15MB Intel Core i7-3960X Extreme Edition so sánh với Core i7-990X Extreme Edition qua ph p thử nặng ký, gồm: Cinebench 11.5, POV-Ray 3.7, 3DMark 11 physics, Pro-Show Gold 4.5, SPECint_rate base2006, SPECfp_rate base2006, SiSoft SANDRA 2011B multimedia băng thông nhớ 35 Qua ph p thử, Core i7-3960X Extreme Edition nhanh khoảng 47.25% so với người tiền nhiệm i7-990X Extreme Edition Intel cho việc tăng hiệu suất vi xử việc tăng IPC thông thường, nhờ băng thông cao 33% sử dụng nhớ quad-channel DDR3 hỗ trợ IMC Ngoài ra, hiệu tăng cường phần nhờ tập lệnh AVX giúp tăng tốc tác vụ nặng toán học mã hóa (encoding) Intel Core i7-3960X Extreme Edition sử dụng socket LGA2011 với nhân, 12 luồng xử nhờ công nghệ HyperThreading, có xung thực 3.3GHz, Turbo Boost 3.9GHz đệm L3 15MB Mẫu CPU cao cấp Sandy Bridge-E Series mắt thị trường vào khoảng cuối năm đầu năm 2012 Tài liệu tham khảo PHẦN KIẾ N TRÚC T ẬP L Ệ NH www.en.wikipedia.org Intel 64 and IA-32 architecture Software Developer‟s Manual Intel® Advanced Encryption Standard (AES) Instructions Set PHẦN SƠ ĐỒ KHỐ I VÀ T HÀNH PH ẦN CHÍNH http://genk.vn http://www.thongtincongnghe.com http://www.tuvantinhoc1088.com PHẦN GIỚI T HIỆ U CHUNG - http://dailyinfo.vn - http://www.vtc-computer.com PHẦN CÔNG NGHỆ MỚI : - http://www.tinhte.vn http://forum.it4.vn http://diendanlaptop.vn 36 ... ta tìm hiểu kiến trúc vi xử lý intel core i7- 990X qua II Giới thiệu chung VXL core i7 đời VXL core i7- 990X  Giới thiệu chung VXL core i7 -Vào thời điểm đời (tháng 11-2008), Core i7 tên mã Bloomfield... 775 Core i7 tương thích với chuẩn Chipset X58 nhớ RAM DDR3 Ki ến trúc vi xử lý Sơ đồ kiến tr úc thành phầ n c hính c VX L Inte l Core i7 990X Đặc điểm kiến trúc vi xử lý : X t bản, kiến trúc. .. 1366, model Core i7- 990X Intel Core i7- 990X phiên Extreme Edition với hệ số nhân không khóa, có nhân sản xuất tiến trình công nghệ 32nm Core i7- 990X thay vương Core i7- 980X, hãng xem xử lý có tốc

Ngày đăng: 25/03/2017, 10:40

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan