Nghiên cứu một số vấn đề lập lịch trên môi trường tính toán đám mây (TT)

54 344 0
Nghiên cứu một số vấn đề lập lịch trên môi trường tính toán đám mây (TT)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC NGUYỄN HOÀNG HÀ NGHIÊN CỨU MỘT SỐ VẤN ĐỀ LẬP LỊCH TRÊN MÔI TRƯỜNG TÍNH TOÁN ĐÁM MÂY CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS Lê Văn Sơn PGS.TS Nguyễn Mậu Hân HUẾ, NĂM 2016 Công trình hoàn thành tại: Trường Đại học Khoa học, Đại học Huế Người hướng dẫn khoa học: PGS.TS Lê Văn Sơn PGS.TS Nguyễn Mậu Hân Phản biện 1: Phản biện 2: Phản biện 3: Luận án bảo vệ Hội đồng chấm luận án cấp Đại học Huế họp tại: Vào hồi ngày tháng năm Có thể tìm hiểu luận án thư viện: Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây MỞ ĐẦU Lý chọn đề tài Tính toán đám mây (TTĐM) đời xuất phát từ nhu cầu tính toán yêu cầu dịch vụ với chi phí thấp người sử dụng Thực tế, để giải công việc tổ chức cần tìm lực tính toán mạnh mẽ chi phí thấp Hiện có cách để giải vấn đề Thứ nhất: nâng cấp sở hạ tầng để tính toán, cách tốn chi phí nhân lực lớn; Thứ hai: tận dụng nguồn tài nguyên nhàn rỗi tổ chức thuê nguồn tài nguyên từ bên Cách giải thứ hai mục tiêu TTĐM TTĐM phát triển tính toán phân tán, gặp phải nhiều thách thức lớn cần phải giải Hiện nay, ngày nhiều nhà cung cấp dịch vụ TTĐM, nhà cung cấp có sách quản lý tài nguyên khác Các tài nguyên đa dạng, không đồng khác mặt kiến trúc, giao diện, khả xử lý, v.v Sử dụng hiệu nguồn tài nguyên hoàn toàn không dễ dàng Tại thời điểm có nhiều người dùng yêu cầu dịch vụ TTĐM, người dùng có yêu cầu ràng buộc khác Vì vậy, để đưa lịch trình tối ưu cho người dùng đem lại lợi ích lớn cho nhà cung cấp thách thức lớn cần phải giải Bài toán lập lịch TTĐM phức tạp nhiều so với toán lập lịch truyền thống việc lập lịch TTĐM phải xét môi trường phân tán, động, tài nguyên từ nhiều nhà cung cấp khác nhau, yêu cầu người dùng có ràng buộc chất lượng dịch vụ khác nhau, v.v Mô hình ứng dụng TTĐM đa dạng nhiều so với mô hình tính toán truyền thống, phải nghiên cứu thuật toán cụ thể để đáp ứng nhu cầu cho dạng ứng dụng cụ thể Chính vậy, toán kiểm soát đầu vào lập lịch cho yêu cầu người dùng TTĐM toán khó, phải tìm thuật toán tối ưu để giải toán Các nghiên cứu trước chủ yếu nghiên cứu lập lịch công việc theo hướng hiệu hệ thống, nhằm mục đích tận dụng tối đa hiệu hệ thống Trên TTĐM, nhà nghiên cứu tập trung nghiên cứu lập lịch công việc theo hướng hiệu kinh tế nhằm đem lại lợi nhuận cho nhà cung cấp, thời gian thực nhỏ cho người dùng đồng thời phải thỏa mãn ràng buộc đặt nhà cung cấp người dùng Các thuật toán lập lịch TTĐM thường thuật toán lập lịch động Vì vậy, tối ưu thời gian đưa lịch trình vấn đề mà nhà khoa học quan tâm nghiên cứu Xuất phát từ việc tìm hiểu, nghiên cứu đặc điểm thách thức vấn đề lập lịch TTĐM, chọn đề tài “Nghiên cứu số thuật Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây toán lập lịch môi trường tính toán đám mây” Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: tác nhân hệ thống lập lịch TTĐM Phạm vi nghiên cứu: luận án tập trung nghiên cứu mô hình tác nhân PaaS xây dựng thuật toán kiểm soát đầu vào lập lịch mức tảng Phương pháp nghiên cứu Luận án sử dụng phương pháp: phương pháp tổng hợp mô hình hóa, phương pháp hệ thống hóa, phương pháp thực nghiệm khoa học Ý nghĩa khoa học thực tiễn Ý nghĩa khoa học • Đề xuất thuật toán lập lịch công việc thời gian thực áp dụng cho lớp toán song song TTĐM Luận án đưa thêm tham số chi phí, kết hợp việc phân nhóm tài nguyên xử lý song song để đưa lịch trình tối ưu chi phí thời gian cho yêu cầu người dùng • Xây dựng mô hình toán học cho nhà cung cấp PaaS đề xuất thuật toán kiểm soát đầu vào lập lịch theo hướng tối ưu đa mục tiêu TTĐM Áp dụng heuristic ACO PSO, luận án xây dựng công thức để tính thông tin heuristic xác xuất kiến; xây dựng hàm thích nghi, vị trí tối ưu cục cá thể vị trí tối ưu toàn cục bầy đàn Từ đó, xây dựng toán đề xuất thuật toán kiểm soát đầu vào lập lịch theo hướng tối ưu đa mục tiêu chi phí thời gian Ý nghĩa thực tiễn: kết nghiên cứu áp dụng thực tế đem lại lợi nhuận cho nhà cung cấp SaaS, tổng thời gian thực thấp thỏa mãn ràng buộc QoS người dùng Luận án sử dụng làm tài liệu tham khảo cho sinh viên học viên cao học ngành Công nghệ Thông tin thực đề tài lập lịch công việc hệ phân tán nghiên cứu heuristic bầy đàn Bố cục luận án Luận án trình bày 107 trang, phần mở đầu (4 trang), kết luận (2 trang), danh mục công trình khoa học tác giả liên quan đến luận án (1 trang) tài liệu tham khảo (8 trang), luận án chia thành chương Chương (25 trang) trình bày tổng quan vấn đề lập lịch tính toán đám mây Chương (28 trang) xây dựng toán thuật toán lập lịch công việc thời gian thực tính toán đám mây áp dụng cho lớp toán song song Chương (39 trang) xây dựng mô hình, toán thuật toán lập lịch công việc theo hướng tối ưu đa mục tiêu tính toán đám mây Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây Chương TỔNG QUAN VỀ CÁC VẤN ĐỀ LẬP LỊCH TRÊN TÍNH TOÁN ĐÁM MÂY 1.1 Tổng quan tính toán đám mây 1.1.1 Giới thiệu TTĐM phát triển tính toán phân tán, tính toán song song tính toán lưới R Buyya I Foster định nghĩa TTĐM hệ phân tán, cung cấp dạng tài nguyên ảo dạng dịch vụ theo nhu cầu người dùng môi trường Internet 1.1.2 Đặc điểm tính toán đám mây Các dịch vụ TTĐM có đặc điểm chung sau: giá rẻ, khả co giãn lớn, độ tin cậy cao, dùng chung tài nguyên độc lập vị trí, khả ảo hóa, truy cập diện rộng, dùng trả nhiêu, độc lập thiết bị nhiều người thuê 1.1.3 Kiến trúc tính toán đám mây Kiến trúc TTĐM Ian Foster chia thành tầng bao gồm: tầng tác chế, tầng tài nguyên hợp nhất, tầng tảng tầng ứng dụng 1.1.4 Các mô hình tính toán đám mây Theo NIST, TTĐM bao gồm mô hình dịch vụ: SaaS, PaaS SaaS mô hình triển khai: đám mây công cộng, đám mây riêng, đám mây cộng đồng đám mây lai 1.1.5 Các thách thức tính toán đám mây Bên cạnh lợi ích to lớn, TTĐM gặp số thách thức bảo mật, lập lịch công việc tắt nghẽn mạng lượng khách hàng lớn 1.2 Công cụ mô tính toán đám mây 1.2.1 Giới thệu Các nhà nghiên cứu thường sử dụng công cụ mô để giảm chi phí tùy biến trình nghiên cứu 1.2.2 Một số công cụ mô tính toán đám mây Hiện nay, nhà nghiên cứu xây dựng công cụ mô TTĐM sau: DCSim, CloudSim, GroudSim TeachCloud Theo đánh giá Rahul Malhotra Parveen Kumar CloudSim công cụ tổng quát nhất, giúp cho người dùng tự xây dựng đám mây hoàn chỉnh Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây 1.2.3 Công cụ mô CloudSim CloudSim công cụ mô có khả mở rộng cao CloudSim cung cấp công cụ để tạo sở hạ tầng, dịch vụ, kiện điều khiển, v.v Người lập trình hoàn toàn tạo đám mây theo mục đích 1.3 Bài toán lập lịch tính toán đám mây 1.3.1 Giới thiệu Theo P Brukner lớp toán lập lịch ba < R, T, γ >, đó: R, T , γ tập tài nguyên, yêu cầu tiêu chí tối ưu toán Một lịch trình xác định hàm f : T → R, yêu cầu ti ∈ T ánh xạ vào tài nguyên rj ∈ R 1.3.2 Mô hình tổng quát để lập lịch trung tâm liệu Mô hình tổng quát để lập lịch TTĐM bao gồm tác nhân hệ thống lập lịch Các tác nhân bao gồm người dùng, nhà cung cấp dịch vụ SaaS, PaaS IaaS Hệ thống lập lịch bao gồm chức mức ứng dụng mức tảng 1.3.3 Các phương pháp lập lịch Bài toán lập lịch giải bốn phương pháp: phương pháp liệt kê, phương pháp heuristic, phương pháp nới giảm tham số phương pháp xấp xỉ 1.3.4 Mô hình kinh tế cho toán lập lịch Trong mô hình kinh tế, chủ yếu tập trung lập lịch hai chiến lược: dựa thị trường (market-based) lập lịch dựa đấu giá (auction-based) 1.4 Các nghiên cứu liên quan đến lập lịch tính toán đám mây Lập lịch hệ phân tán tính toán lưới TTĐM có hai cách tiếp cận chính: hướng hiệu hệ thống hướng đến hiệu kinh tế Y Chawla chia lập lịch công việc TTĐM thành loại: lập lịch tĩnh, lập lịch động, lập lịch heuristic, lập lịch luồng công việc lập lịch công việc thời gian thực 1.4.1 Lập lịch tĩnh động Năm 2010, S Pandey đề xuất thuật toán lập lịch cho toán có khối lượng công việc lớn Tuy nhiên, thuật toán bỏ qua chi phí tính toán quan tâm đến chi phí truyền thông Năm 2013, S.Nagadevi liệt kê kỹ thuật lập lịch tĩnh, kỹ thuật áp dụng cho yêu cầu độc lập, máy ảo thực thời gian sẵn sàng máy ảo cập nhật sau yêu cầu hoàn thành Năm 2012, Z Lee M Choudhary đề xuất thuật toán lập lịch ưu tiên động, thuật toán xem xét nhà cung cấp dịch vụ, nhà cung cấp tài nguyên khách hàng để đưa thuật toán nhằm đem lại thời gian chi phí nhỏ không xem xét ràng buộc thời hạn ngân sách yêu cầu Từ năm 2010 đến 2013, J Deng, Lee HanZhao đưa mô hình lập lịch cho yêu cầu TTĐM với mục Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây tiêu đem lại lợi nhuận cho nhà cung cấp dịch vụ xem xét đến chi phí tính toán, chưa xem xét đến chi phí truyền thông thời gian gối đầu yêu cầu 1.4.2 Lập lịch heuristic Từ năm 2010 đến 2012, R Buyya đồng đề xuất thuật toán lập lịch công việc TTĐM theo hướng hiệu hệ thống Nhóm tác giả kết hợp với xử lý song song, heuristics động P SO để xử lý công việc với khối lượng lớn Tuy nhiên thuật toán áp dụng cho lớp toán có khối lượng lớn, thời gian truyền liệu lớn nhiều so với thời gian tính toán K Li (2011) S Zhan (2012) sử dụng heuristic bầy đàn để đưa lịch trình tối ưu thời gian thực hiện, không quan tâm đến ràng buộc QoS người dùng Để tối ưu thời gian thực hiện, K Liu (2009), X Song(2011), Z Bo(2011), V D Bossche (2012) sử dụng heuristic ACO, GA nhằm đưa lịch trình với mục tiêu đem lại thời gian hoàn thành nhỏ cho hệ thống thỏa mãn ràng buộc QoS người dùng Các nghiên cứu tập trung vào ràng buộc thời gian, không quan tâm đến chi phí hệ thống 1.4.3 Lập lịch luồng công việc Năm 2008, Z Yu đề xuất thuật toán lập lịch đa luồng Thuật toán lập lịch cho yêu cầu dựa độ ưu tiên yêu cầu không xem xét đến ràng buộc QoS người dùng Năm 2012, S K Jayadivya tập trung lập lịch đa luồng, dựa vào ràng buộc QoS người dùng Các thuật toán đưa lịch trình có thời gian thực chi phí thấp không quan tâm đến ngân sách yêu cầu 1.4.4 Lập lịch công việc thời gian thực Từ năm 2010 đến 2011, S Liu, Y.Gu Zhu tập trung lập lịch công việc thời gian thực thỏa mãn ràng buộc QoS người dùng Tuy nhiên, thuật toán chưa áp dụng kỹ thuật xử lý song song để tận dụng hết khả máy ảo, chưa tận dụng khoảng thời gian gối đầu yêu cầu để tiết kiệm chi phí Năm 2013, N Ramkumar nghiên cứu lập lịch yêu cầu thời gian thực sử dụng hàng đợi ưu tiên để ánh xạ yêu cầu vào tài nguyên tập trung lập lịch để giải công việc cách nhanh thỏa mãn thời hạn yêu cầu mà không quan tâm đến chi phí ngân sách 1.5 Mục tiêu đề tài Mục tiêu nghiên cứu luận án: xây dựng mô hình toán để lập lịch công việc thời gian thực áp dụng cho lớp toán song song; xây dựng mô hình toán lập lịch công việc nhà cung cấp PaaS theo hướng tối ưu đa mục tiêu chi phí thời gian; đề xuất thuật toán lập lịch công việc thời gian thực áp dụng cho lớp toán song song thuật toán kiểm soát đầu vào lập lịch công việc theo hướng tối ưu đa mục tiêu Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây Chương LẬP LỊCH CÔNG VIỆC THỜI GIAN THỰC TRONG TÍNH TOÁN ĐÁM MÂY 2.1 Mô hình lập lịch truyền thống Các nghiên cứu trước đây, toán lập lịch giả thuyết số lượng công việc số lượng máy tham gia tính toán cố định M L Pinedo đưa mô hình toán lập lịch bao gồm thành phần: mô hình máy tham gia lập lịch, mô hình công việc mục tiêu toán 2.2 Mô hình lập lịch công việc thời gian thực Mục tiêu lập lịch công việc thời gian thực tăng công suất, tận dụng tối đa hiệu hệ thống cho thỏa mãn thời hạn cho công việc Luận án xây dựng toán lập lịch với ràng buộc người dùng ứng dụng song song xem xét việc lựa chọn tài nguyên theo hai mục tiêu: thời gian hoàn thành công việc nhỏ thỏa mãn thời hạn ngân sách yêu cầu; chi phí thực nhỏ thỏa mãn ràng buộc QoS cho yêu cầu 2.2.1 Mô tả toán Ứng dụng bao gồm tập yêu cầu T , yêu cầu ti ∈ T có thời điểm đến , thời hạn di (chỉ rõ phút) ngân sách (budget) bi (chỉ rõ $) khối lượng công việc wi Khối lượng công việc yêu cầu song song hóa vào đơn vị nhỏ (yêu cầu con), kích cỡ nhỏ yêu cầu p R tập tài nguyên có sẵn thực song song Mỗi tài nguyên rj ∈ R có tốc độ tính toán sj tương ứng chi phí cj để thuê máy ảo Tốc độ sj số chu kỳ tài nguyên hoàn thành phút Người dùng trả chi phí cj để thuê tài nguyên rj khoảng D phút liên tục, D đơn vị nhỏ để thuê Bài toán thứ mô tả sau: “Tìm ánh xạ từ tập yêu cầu T vào tập tập tài nguyên R để tối thiểu tổng thời gian thực thỏa mãn thời hạn ngân sách yêu cầu T ” Bài toán thứ 2: “Tìm ánh xạ từ tập yêu cầu T vào tập tập tài nguyên R để nhỏ toàn chi phí thỏa mãn thời hạn ngân sách yêu cầu T ” 2.2.2 Mô hình toán học cho toán Luận án mở rộng mô hình K.H Kim K Kumar, thời hạn phải xem xét ngân sách yêu cầu, đảm bảo yêu cầu thực trước thời hạn không vượt ngân sách Gọi R = {r1 , r2 , , rM } tập M tài nguyên tính toán, Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây tài nguyên thực song song Mỗi tài nguyên rj ∈ R , sj tốc độ tính toán tính phút, cj chi phí để thuê tài nguyên khoảng thời gian D phút Các tài nguyên nguồn tính toán cho N yêu cầu độc lập, biểu diễn tập T = {t1 , t2 , , tN }, yêu cầu ti ∈ T Gọi amin , dmax thời điểm đến nhỏ thời hạn lớn tất yêu cầu Ký hiệu α(j, k, x) để thể việc chọn tài nguyên:  1 phút x, tài nguyên rj sử dụng từ đến k lần α(j, k, x) = 0 phút x, tài nguyên r không sử dụng (2.1) j Tổng chi phí tài nguyên phút thứ x (x = amin dmax ) tính sau: M y Scost (x) = j=1 k=1 cj × α(j, k, x) D Trong đó, M số tài nguyên R, y = C p (2.2) với: N C= wi (2.3) i=1 p = min{sj , j = M } (2.4) Tổng số chu phút thứ x xác định sau: M y sj × α(j, k, x) Scycle (x) = (2.5) j=1 k=1 2.2.3 Mục tiêu tối ưu chi phí Để đạt mục tiêu nhỏ chi phí phải tìm cực tiểu tổng chi phí: dmax Scost (x) → (2.6) x=amin Để đạt mục tiêu công thức (2.6) phải thỏa mãn hai ràng buộc yêu cầu ti ∈ T : di Scost (x) ≤ bi (2.7) Scycle (x) ≥ wi (2.8) x=ai di x=ai 2.2.4 Mục tiêu tối ưu thời gian Để đạt mục tiêu tối ưu thời gian thực cho yêu cầu phải tìm cực đại tổng số chu kỳ: dmax Scycle (x) → max x=amin Để đạt mục tiêu phải thỏa mãn hai ràng buộc (2.7) (2.8) (2.9) Nghiên cứu số thuật toán lập lịch môi trường tính toán đám mây 2.3 Tối ưu kinh tế Mỗi máy ảo nhà cung cấp IaaS thuê D-phút nhà cung cấp SaaS phải trả chi phí cố định D-phút thuê, họ không sử dụng hết D-phút họ phải trả chi phí cho toàn D-phút Luận án tận dụng khoảng thời gian hiệu lực vòng D-phút thuê yêu cầu để thực cho yêu cầu khác nhằm đem lại lợi nhuận cao cho nhà cung cấp SaaS Gọi Ti tập yêu cầu nhà cung cấp với yêu cầu ti gối đầu lên yêu cầu ti , yêu cầu chia sẻ máy ảo Ti xác định sau: Ti = tl |dl ≥ di al < di (2.10) Gọi tiljx thời gian hiệu lực để tính toán cho yêu cầu tl sau thực xong yêu cầu ti máy ảo vmjx tiljx xây dựng sau:   min(D − Uiljx , dl − al ) al − ≥ swijxi    tiljx = D − Uiljx al − < swi dl − ≥ D ijx    d − (a + U )nếu a − a < wi d − a < D l Trong đó: Uiljx = wi sijx i iljx l i l sijx (2.11) i + max(al − di , 0) sijx tốc độ vmjx ánh xạ vào ti Nếu xét nhà cung cấp IaaS công thức (2.11) xây dựng lại sau:   min(D − Uilj , dl − al ) al − ≥ swiji    tilj = D − Uilj al − < swi dl − ≥ D (2.12) ij    d − (a + U )nếu a − a < wi d − a < D l i ilj l i sij l i 2.4 Thuật toán lập lịch hệ thống thời gian thực 2.4.1 Thuật toán lập lịch tối ưu thời gian Các thuật toán sử dụng để giải toán thứ 2.4.1.1 Thuật toán CT O Các bước Thuật toán CT O mô tả Thuật toán 2.1 Nhận xét: thuật toán CT O tối ưu thời gian, đảm bảo yêu cầu hoàn thành trước thời hạn nó, thuật toán số hạn chế: thuật toán CT O xem xét số tài nguyên (máy ảo) nhà cung cấp, xét nhiều nhà cung cấp độ phức tạp thuật toán lớn; yêu cầu hoàn thành trước thời hạn không thỏa mãn ngân sách nó; thời gian thuê tài nguyên D phút có nhiều yêu cầu không sử dụng hết D phút 2.4.1.2 Thuật toán M IN C Để khắc phục hạn chế thuật toán CT O, xây dựng thuật toán M IN C nhằm tận dụng khoảng thời gian hiệu lực yêu cầu với mục tiêu tối ưu chi Researching on some scheduling problems in the cloud computing environment D − minutes Algorithm M IN C utilizes valid time to implement for the next requests, which leads to reduce the implementation cost for systems and makes benefits for provider SaaS • The complexity of the algorithm CT O is O(max(M × log2M , G, N × M )) If N > log2M , the complexity of CT O is O(N × M ), else, the complexity of CT O is O(M × log2M ) The complexity of the algorithm M IN C is O(max(N , N × G)), the situation happened most is N > G, the complexity of M IN C is O(N ), whereas the complexity of M IN C is O(N × G) 2.4.1.4 Simulation and evaluation algorithms The algorithms are installed simulation by the tool CloudSim 2.0, using Data Center, hosts, 50 virtual machines, the number of requests vary from 100 to 250 The schedule given by algorithms CT O and M IN C compared with greedy algorithm EDF (a) Comparison the total time of the algorithms(b) Comparison of the total cost of the algorithms when changing the number the requests when changing the number of requests (c) Comparison of the total execution time of the 3(d) Comparison of the total cost of the algorithms algorithms when changing the ρ when changing the ρ Figure 2.1: Comparison of the total cost and time when changing the number of requests and thresholds 11 Researching on some scheduling problems in the cloud computing environment Analysis of the total execution time and cost when changing the number of requests Figure 2.1(a) and (b) represents of the total execution time and cost of the algorithms when ρ = 5, D = 60, using 50 virtual machines and the requests vary from 100 to 250 Analysis of total time and cost when changing the threshold ρ We change ρ from to 5, D = 60, use 250 requests and 50 virtual machines and the result of the algorithms is shown in figure 2.1(c) and figure 2.1(d) 2.4.2 Optimal scheduling algorithm on cost 2.4.2.1 Algorithm T CO Algorithm TCO steps are describe in Algorithm 2.3 Algorithm 2.3: TCO Input : • T = {t1 , t2 , , tN }, ∀ti ∈ T is 4-tuple < , di , bi , wi >; • R = {r1 , r2 , , rM }, ∀rj ∈ R is 2-tuple < sj , cj > Output: Array Result contains the number of resources for each request; Method: Choosing threshold ρ ∈ (0, 1] ; Sort all the resources follow ascending order of cost ; Basing on ρ threshold to group resources according to cost ; G := the number of grouped resources; RG := {g1 , g2 , , gG }, gl ∈ G which contain the group of resources; In each group, sort all resources follow descending order of speed; Result:= CalculateParallel(RG, T ); 2.4.2.2 Simulation and evaluation algorithms As algorithm CT O, algorithm T CO is installed by simulation tools CloudSim 2.0, using Data Center, host, 50 virtual machines, the requests vary from 100 to 250 The schedule of T CO and M IN algorithms are compared with the greedy algorithm EDF Analysis of the total cost and time when changing the number of requests Figure 2.2(a) and (b) show the total cost and the total execution time of T CO, M IN C and EDF algorithms when ρ = 0.5,D = 60, using 50 virtual machines and the requests vary from 100 to 250 The total costs analysis and the total time when changing the ρ threshold Figure 2.2 (c) and (d) show the results of the algorithms when it changes the ρ threshold from 0.1 to 0.5, D = 60, using 200 requests and 50 virtual machines 12 Researching on some scheduling problems in the cloud computing environment (a) Comparison of the total cost of the algorithms(b) Comparison of the total time of the algorithms when changing requirements when changing requirements (c) Comparison of the total cost of the algorithms(d) Comparison of the total time of the algorithms when changing ρ when changing ρ Figure 2.2: Comparison of total cost and total time when changing requirements and threshold 2.5 Summary of chapter This chapter focuses on describing and modeling to the problem of real-time task scheduling in the parallel applications Combined with parallel processing, clustering and proposing three algorithms such as CT O, M IN C and T CO algorithms to solve two problems follow as : • The scheduling problem on the real-time system towards time-optimal • The scheduling problem on the real-time system towards cost-optimal 13 Researching on some scheduling problems in the cloud computing environment CHAPTER TASK SCHEDULING TOWARD THE MULTI-OBJECTIVE OPTIMIZATION IN THE CLOUD COMPUTING 3.1 Scheduling model towards the multi-objective optimization In the cloud computing, each agent has requirements about services with different objectives such as SaaS vendors which need to bring the greatest benefit for themselves; PaaS providers need to leverage resources effectively, etc 3.1.1 Users model The study extends users model of Buyya R by developing additional attributes such as deadline, budget, etc We consider on the N requests T = {t1 , t2 , , tN }, each request is the 7-tuple < , di , bi , αi , wi , ini , outi >, in which: : the arrival time of the request; deadline di ; the budget bi ; αi : the penalty interest rate; the workload wi ; size of input and output file: ini and outi 3.1.2 IaaS providers model We consider on Y IaaS providers: X = {1, 2, , Y } Each provider x ∈ X provides Mx vitual machine for SaaS provider, is represented by a set V Mx = {vm1x , vm2x , , vmMx x } According to IaaS model of R Buyya, each virtual machine vmjx ∈ V Mx is the 5-tuple < tjx , pjx , sjx , dtpjx , dtsjx >, of which: the initialization time tjx ; pjx cost; the processing speed sjx ; the transmission pricing dtpjx ; the transmission speed dtsjx 3.1.3 PaaS Provider Model The thesis proposes PaaS provider model is the 3-tuple : < R, npmtn, Cmin > and < R, npmtn, Tmin > In there, R is a set of independent IaaS provider and resources of providers can execute in parallel, npmtn is the set N independent request which no particular order of priority (non-preemptive) Our aim is scheduled for user’s requirements on the set resources of IaaS providers towards cost optimization and optimization of time means to find Cmin and Tmin Calling Cijx is the cost to process the request ti ∈ T on vmjx ∈ V Mx According to the user’s model and IaaS provider model, the cost of Cijx is calculated as follows: wi (3.13) CPijx = pjx × sjx CT Dijx = dtpjx × ini + outi dtsjx CIijx = tijx × pijx 14 (3.14) (3.15) Researching on some scheduling problems in the cloud computing environment CRijx = αi × βijx (3.16) Calling Tijx is the time to process the request ti ∈ T on vmjx ∈ V Mx : Tijx = CTijx + DTijx + T Iijx + βijx (3.17) where: wi sjx (3.18) ini + outi dtsjx (3.19) CTijx = DTijx = T Iijx : virtual machine initialization time is given βijx : exceeded time deadline The objective function of requested costs ti ∈ T are represented as follows: fcost (ti ) = x=1 Y, j=1 Mx {Cijx } (3.20) and the objectives of SaaS provider is find the maximum of the total profit: N (bi − fcost (ti )) → max (3.21) i=1 and satisfy two constraints for the request ti : Cijx < bi (3.22) Tijx ≤ di + βijx (3.23) The objective function of time for the request ti ∈ T are represented as follows: ftime (ti ) = x=1 Y, j=1 Mx {Tijx } (3.24) and the user’s target is find the minimum total execution time: N (ftime (ti )) → (3.25) i=1 and satisfy two constraints (3.22) and (3.23) 3.2 Construction problems towards multi-objective optimization In this section, we study the ACO heuristic and P SO heuristic to build the problems to achieve the goal for users and SaaS vendors 3.2.1 Ant Colony optimization (ACO) Initially proposed by Marco Dorigo in 1992 in his PhD thesis, the first algorithm was aiming to search for an optimal path in a graph, based on the behavior of ants seeking a path between their colony and a source of food To apply ACO algorithm on a specific problem, the thesis build some information: F minimum function, η information heuristic, pheromone update and probability P as follows: With the aim of the cost optimizing, F minimal function and heuristic information to 15 Researching on some scheduling problems in the cloud computing environment request ti ∈ T find vmx ∈ V Mx is defined as follows: F (ti ) = x=1 Y, j=1 Mx ηijx = {Cijx } (3.26) Cijx (3.27) With the aim of the time optimizing, F minimum function and ηijx is defined as follows: F (ti ) = x=1 Y, j=1 Mx ηijx = {Tijx } (3.28) Tijx (3.29) Pheromone update: τijx = (1 − ρ)τijx + ∆τijx (3.30) The probability to ti ∈ T select vmjx ∈ V Mx : τijx ηijx Pijx = Y Mx x=1 j=1 τijx ηijx (3.31) With the aim of the cost optimizing, the probability that ti ∈ T select vmjx ∈ V Mx is calculated as follows: (1 − ρ)τijx + Pijx = Y x=1 Mx j=1 1−ρ F (ti ) (1 − ρ)τijx + Cijx 1−ρ F (ti ) (3.32) Cijx With the aim of the time optimizing, the probability that ti ∈ T select vmjx ∈ V Mx : (1 − ρ)τijx + Pijx = Y x=1 Mx j=1 1−ρ F (ti ) (1 − ρ)τijx + Tijx 1−ρ F (ti ) (3.33) Tijx 3.2.2 Particle Swarm Optimization (P SO) P SO algorithm based on the experience of the swarm which being proposed by Eberhart and Kennedy To apply P SO algorithm on specific problems, the thesis build the following information: location, speed, fitness function, local and global optimization position as follows: M Clerc has given formula to update the location and velocity of each particle as follows: vxj+1 = K ωvxj + c1 z1 (P bestx − posjx ) + c2 z2 (Gbest − posjx ) (3.34) posj+1 = posjx + vxj+1 x (3.35) where: K the coefficient of convergence, posjx : position of particle x in dimension j; posj+1 x : position of particle x in dimension j +1; c1 ,c2 : acceleration coefficient; z1 ,z2 : random number between and 1; vxj : velocity of particle x in dimension j; P bestx : local best position of particle x; Gbest: global best position of the entire swarm Fitness function for particle x to select virtual machine j for request i: Fcost (posjix ) = Cijx Local optimal position of particle x in j + dimensions for ti : 16 (3.36) Researching on some scheduling problems in the cloud computing environment pbj+1 ix = j pbj+1 if Fcost (posj+1 ix ix ) ≥ Fcost (posix ) and Cijx ≤ bi and Tijx ≤ di + βijx pbjix Orther , (3.37) Local best position of particle x (P bestx) and global best position (Gbest): P bestx = max x=1 Y, j=1 Mx {pbjix } Gbest = max {P bestx } x=1 Y (3.38) (3.39) 3.3 Scheduling algorithm for multi-objective optimization based on ACO 3.3.1 Description of problems The applications include N service requests , is represented by a set T = {t1 , t2 , , tN }, each request ti ∈ T is 7-tuple < , di , bi , αi , wi , ini , outi > is sent to SaaS providers including QoS constrains and properties as shown in section 3.1.1 SaaS vendors lease resources from Y IaaS providers Each vendor x(x = Y ) provides Mx vitual machine, each vmjx ∈ V Mx is 5-tuple < tjx , pjx , sjx , dtpjx , dtsjx > as shown in section 3.1.2 Upon receiving a set of user requirements, PaaS providers calculate the cost and time taken as the model in section 3.1.2 Since then, giving the decision to refuse or accept the request of users If the request is accepted, the scheduler will mapped into logical resource 3.3.2 Scheduling algorithm for multi-objective optimization on costs 3.3.2.1 Algorithm ACACO The target of ACACO algorithms bring the greatest benefit for SaaS providers The steps of the algorithm is described in Algorithm 3.4 3.3.2.2 Scheduling algorithm M P rof it Algorithm M P rof it utilize the valid time within D − minute was hired by the requirements in the same suppliers to provide the highest profits for SaaS provider The steps of the algorithmM prof it are described in Algorithm 3.5 3.3.2.3 Analysis ACACO and M prof it algorithms • Thomas Stutzle, Marco Dorigo has proved the convergence of ACO algorithm which ensure the convergence of proposed algorithm ACACO • Like algorithm CT O, at the time of scheduling set the input data X and T , V Mx which fully determined • Algorithm ACACO mappings ti ∈ T into vmjx ∈ V Mx based on probability Pijx like 3.32 Thus, when the virtual machine’s cost vmjx is the lower the heuristic information is the bigger, this thing leads to pheromone and probability to select 17 Researching on some scheduling problems in the cloud computing environment Algorithm 3.4: ACACO Input : • T = {t1 , t2 , , tN }, ∀ti ∈ T is the 7-tuple < , di , bi , αi , wi , ini , outi > ; • X = {1, 2, , Y }, V Mx = {vm1x , vm2x , , vm(M x)x }, ∀x ∈ X; Output: A schedule S = {ti → vmjx , ti ∈ T, vmjx ∈ V Mx }; Method: S := ∅; foreach ti ∈ T si := T est(ti , X, V Mx ); if si = ∅ then Inform the users that the request has been reject; else S := S ∪ {si }; return S; Function Test(ti ∈ T, X, V Mx ) ST := ∅; foreach ant k foreach x ∈ X Calculating heuristic information for request ti on virtual machines vmjx : ηijx := ; CPijx +CT Dijx +CIijx +CRijx Find the value of current pheromone : τijx ; Calculate execution time as the formula (3.17); Pheromone update as the formula (3.30): τijx := (1 − ρ)τijx + Calculate the probability for request ti map into virtual machine vmjx as 1−ρ ; F (ti ) the formula (3.32); From the probability on virtual machines vmjx , find the virtual machine which has the highest probability and satisfy constraints (3.22) and (3.23); if found vmjx then 10 ST := ST ∪ {ti → vmjx } ; 11 12 if ti ∈ / ST then 13 return ∅; 14 else 15 Find the best solution of si by analyzing the ants in scheduling list of ST ; 16 return si 18 Researching on some scheduling problems in the cloud computing environment Algorithm 3.5: Mprofit Input : U ST := S ; Output: An optimal schedule ST to map the request to virtual machine.; Method: ST:= ∅ ; Sort the mapping of U ST by provider ; G := {g1 , , gY }, gx ∈ G which contain the group of mappings on provider x; Creating Y thread running simultaneously: T H := {th1 , th2 , , thY }, thx ∈ T H find corresponding resources in group gx ∈ G; foreach thx ∈ T H /* ti is the first mapping of the group gx ∈ G */ P U SH(ti ) ; ST := ST ∪ {ti }; gx := gx \ {ti }; while gx = ∅ ti := P OP () ; /* Get ti from stack */ 10 Find Ti := {tl |dl ≥ di and al < di and tl is the same group with ti }; 11 Calculate tiljx of the requirements in the Ti as formula (2.11); 12 Base on max(tiljx ) to find tl ; 13 if tl satisfy deadline as constraint (3.23) then Recalculate wl and update the state for tl 14 15 else 16 if |gx | > then 17 tl := ti+1 ; else 18 break ; 19 20 21 /* ti+1 is mapping not reviewed yet in gx */ P U SH(tl ); ST := ST ∪ {tl }; gx := gx \ {ti }; Base on ST to produce the mapped schedule onto the request of resources.; virtual machine vmjx is the greater Therefore, when the mapping requirements into virtual machines with the low cost will make decrease the total cost of the entire system • For M prof it algorithm: after sorting the requirements of provider will create G groups, each group will contain the requirements to be accepted on each vendor Therefore, we can apply the model memory sharing to generate G thread, this thing will give the time optimal of schedule for the algorithm The resource rental period is D − minute, therefore request ti completes its task on itself with the lesser time than D − minute, but to pay the fee of D − minute Mprofit algorithm takes advantage of this effective time interval to process the next request, which makes 19 Researching on some scheduling problems in the cloud computing environment the costs of the entire system reduced, according to the objectives of SaaS providers • The complexity of the algorithm ACACO is: O(N × Y × Mx ) • The complexity of the algorithm M P rof it is: O(N ) 3.3.2.4 Simulation and evaluation algorithms The algorithms are installed in the Java language, the package tool CloudSim with the parameters: using Datacenter, 10 physical hosts, the virtual machine changes from 100 to 500 and the number of requested changes from 1000 to 5000 The ACACO algorithm and M prof it be compared to the greedy algorithm EDF (a) Total cost when change the requests (b) Total request are fined when change the request (c) Total cost when change the virtual machines (d) Total time when change the virtual machines Figure 3.1: The total cost and the number of requests are fined when change the number of requests and the virtual machines Figure 3.1 (a) and (b) presented the results of the total cost and the total number of requests are fined by the three algorithms when change the number of requests from 1000 to 5000 and fixed number of virtual machines are 100 Figure 3.1 (c) and (d) presented the results the three algorithms when fix the number of request is 1000 and change the number of virtual machines from 100 to 500 20 Researching on some scheduling problems in the cloud computing environment 3.3.3 Scheduling algorithm for multi-objective optimization on times The objective of the algorithm bring the minimum execution time for the users 3.3.3.1 Admission control algorithm and scheduling ACT ACO The idea of this algorithm like ACACO algorithm but having change of the target and using the formula 3.28, 3.29, 3.30 and 3.33 to determine minima function F , heuristic information ηijx , and pheromone update the probability P 3.3.3.2 Simulation and evaluation of algorithms Figure 3.2 (a) and (b) presented the results of the total time and the total cost of the algorithm when use 1000 requests and 100 virtual machines Figure 3.2 (c) and (d) presented the results of the algorithm when use 100 virtual machines and the number of changing requirements from 1000 to 5000 (a) The total time when fix the number of requests (b) Total cost when fix the number of requests (c) Total time when change the number of requests (d) Total cost when change the number of requests Figure 3.2: Simulation results of the algorithms 3.4 Scheduling algorithm for multi-objective optimization based on P SO In this section, the study apply heuristic P SO to search the resources for user requests and propose some algorithms based on the problem construct at the section 3.2.2 21 Researching on some scheduling problems in the cloud computing environment 3.4.1 Describe the problem The problem is described in the section 3.3.1 3.4.2 Optimal algorithm ACP SO 3.4.2.1 Algorithm ACP SO Algorithm 3.6: ACPSO Input : • T = {t1 , t2 , , tN }, ∀ti ∈ T is 7-tuple < , di , bi , αi , wi , ini , outi > ; • X = {1, 2, , Y } ∀x ∈ X, V Mx = {vm1x , vm2x , , vm(M x)x }, ∀vmjx ∈ V Mx is 5-tuple < tjx , pjx , sjx , dtpjx , dtsjx > ; Output: A schedule S = {ti → vmjx , ti ∈ T, vmjx ∈ V Mx } ; Method: Initialization: position, velocity of each particle, S, P bestx , Gbest, K and ϕ; Creating Y thread running simultaneously: T H := {th1 , th2 , , thY }, thx ∈ T H find corresponding resources in x ∈ X; foreach ti ∈ T foreach thx ∈ T H Calculating fitness function as formula (3.36); Finding the local optimal of the particle x as formula 3.37; Calculating P bestj and Gbesti as formula (3.38), (3.39); Base on Gbesti , finding vmjx satisfying constraints as (3.22) and (3.23); if found vmjx then 10 11 12 S := S ∪ {ti → vmjx } ; else Inform the users that the request has been reject; 13 foreach thx ∈ T H 14 for j:=1 to Mx 15 vxj+1 := K (ωvxj + c1 z1 (P bestx − posjx ) + c2 z2 (Gbest − posjx )); 16 posj+1 := posjx + vxj+1 ; x 3.4.2.2 Analysis algorithm ACP SO • M Clerc proved the convergence of PSO algorithm P SO This ensure the convergence of the algorithm ACP SO • As algorithm ACACO, the input of the algorithmACP SO at the time of scheduling can determine : T , X, V Mx • For ACP SO algorithm: the input of the algorithm is Y the independent vendor of each other, so we can create the Y thread which runs simultaneously, each thread 22 Researching on some scheduling problems in the cloud computing environment thx ∈ T H is an particle that we can search on the virtual machines of provider This will reduce complexity and optimize the scheduling time of algorithm Each individual (thread) focused on requirements mapping ti ∈ T into vmjx ∈ V Mx based on fitness function as formula 3.36 So, the lower the cost Cijx is , the higher fitness function is, the probability to request ti select VMs vmjx is more greater Therefore, if requirements mapping into virtual machines is low, the total cost of system will decrease • - The complexity of the algorithm ACP SO is: O(N × Mx ) 3.4.2.3 Simulation and evaluation of algorithms The parameters in the simulation are defined in section 3.3.2.4 Figure 3.3 (a) and (b) shown the results of comparison about the total of cost and the total of profit when fixed 1000 requests and 150 virtual machines Figure 3.3 (c) and (d) presented the results when changing requirements and the use of 150 virtual machines (a) The total of cost when fixed the request (b) The total of profit when fixed the request (c) The total of cost when changed the request (d) The total of profit when changed the request Figure 3.3: The simulation results of the algorithms 3.5 Summary chapter This chapter focuses on construction algorithm: ACACO, ACT ACO, M prof it and ACP SO to solve the problem of multi-objective optimization about the cost and time for providers and users 23 Researching on some scheduling problems in the cloud computing environment CONCLUSION The main content of the study is achieved as follows: Proposing the model and some real-time task scheduling algorithms for which are applied to parallel problems toward the time and cost optimization We combine parallel processing, group resources according to the cost and time, as well as take the advantage of overlapping time between the request to propose three algorithms: CT O, T CO and M IN C Through the simulation, analysis and evaluation, the results of three algorithms optimized for cost and time are better than EDF algorithm Constructing a model for all the components in cloud computing environment The thesis applies the mathematical model of the IaaS provider and develops the properties of users by R Buyya and colleagues are proposed it Since then, we focus on building the models for PaaS providers and model which optimal about the cost for SaaS provider Proposing some the scheduling algorithms towards the cost multi-objective optimization based on parallel processing, heurictis ACO and P SO For heurictis ACO, the thesis build minimum function, heuristic information and probability to select the resources which have the lowest cost For P SO heurictis, the thesis build fitness function to give the optimization of the cost and the new local positions formula which satisfy the user’s QoS Since then, three algorithms are proposed ACACO, ACP SO and M prof it All three algorithms bring the biggest benefits for SaaS providers, the lowest cost for the user but its still satisfying constraint QoS requirements Three of algorithms are installed and simulated on CloudSim and are compared with the Sequential and EDF algorithms According to analyze and evaluate the results of the simulation show that the algorithm M prof it applied for ACACO algorithm always have low cost Although the result of ACP SO algorithm has higher costs ACP SO algorithm but ACP SO algorithm run faster and load balancing than ACACO algorithm Proposing some the scheduling algorithms towards time multi-objective optimization based on heurictis ACO The thesis propose ACT ACO algorithms and combined with M prof it algorithms to optimize the time for users and benefit for SaaS vendors, but its still satisfying constraints of the required QoS Through the analysis and evaluate of simulation on CloudSim, we see that when we combine two algorithms M prof it and ACT ACO together, the results have improvement more significant about the time and cost than the Sequential and EDF algorithms However, when the request make the scheduling if a request fails, the thesis has not yet researched the reschedule capabilities In the simulation, the thesis has not yet studied the optimal scheduling algorithm to provide the virtual machines on the data center There exist more limitations in the present thesis and this is also the development of the study in the near future 24 Researching on some scheduling problems in the cloud computing environment LIST OF RELATED RESEARCH PROJECTS PULISHED BY AUTHOR Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, Dynamic scheduling algorithm in cloud computing environment based on heuristic and Steiner trees, Proceedings of 15th National Symposium “Some selected issues of Information Technology and Communication”, pages 436 - 442, 2013 Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, An algorithm scheduling in cloud computing environment based on ACO algorithm, Proceeding of the 6t h National Conference “Fundamental and Applied Information Technology Research” , pages 331 - 340, 2013 Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, Nguyen Thanh Binh, Resource allocation to tasks on cloud computing based on deadline and budget constraints, Journal of Science and Technology, University of Da Nang, 7(80):107 - 110, 2014 Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, Locate resources for tasks on cloud computing based on QoS constraints, Journal of Science and Technology, section on Information and Communication Technology (JICT), Le Quy Don Technical University, 5: 58 - 71, 2014 Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, Admission Control to schedule for user requirements based on QoS constraints in Cloud Computing, Journal of Information Technology and Communications ,13(33): 16 - 25, 2015 Nguyen Hoang Ha, Le Van Son, Nguyen Mau Han, Scheduling algorithms for user requirements on cloud computing base on heuristic PSO, Journal of Science, University of Hue, 7(106): 83 - 96, 2014 Nguyen Hoang Ha, Nguyen Thanh Binh, Scheduling algorithm for user requirements on cloud computing base on deadline and budget constraints, Journal of Computer Science and Cybernetics, (31):231-243, 2015 Ha Nguyen Hoang, Son Le Van, Han Nguyen Mau, Cuong Phan Nhat Bien, Admission Control and Scheduling Algorithms Based on ACO and PSO Heuristic for Optimizing Cost in Cloud Computing, 8th Asian Conference on Intelligent Information and Database Systems (ACIIDS) 2016, volume 642 of Studies in Computational Intelligence, pages 15 28, Springer, 2016 25

Ngày đăng: 27/10/2016, 16:39

Từ khóa liên quan

Mục lục

  • M u

  • Tng quan v các vn lp lich trên tính toán ám mây

    • Tng quan v tính toán ám mây

      • Gii thiu

      • Ðc im cua tính toán ám mây

      • Kin trúc cua tính toán ám mây

      • Các mô hình trên tính toán ám mây

      • Các thách thc trên tính toán ám mây

      • Công cu mô phong trên tính toán ám mây

        • Gii thu

        • Mt s công cu mô phong trên tính toán ám mây

        • Công cu mô phong CloudSim

        • Bài toán lp lich trên tính toán ám mây

          • Gii thiu

          • Mô hình tng quát lp lich trên các trung tâm d liu

          • Các phng pháp lp lich

          • Mô hình kinh t cho bài toán lp lich

          • Các nghiên cu liên quan n lp lich trên tính toán ám mây

            • Lp lich tınh và ng

            • Lp lich heuristic

            • Lp lich lung công vic

            • Lp lich công vic thi gian thc

            • Muc tiêu cua tài

            • Lp lich công vic thi gian thc trong tính toán ám mây

              • Mô hình lp lich truyn thng

              • Mô hình lp lich công vic thi gian thc

                • Mô ta bài toán

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan