Nghiên cứu một số kỹ thuật khai phá dữ liệu cho bài toán dự đoán rủi ro tín dụng

79 773 1
  • Loading ...
1/79 trang

Thông tin tài liệu

Ngày đăng: 25/03/2015, 09:52

ðẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ðẠI HỌC CÔNG NGHỆ NGUYỄN VĂN TOÀN NGHIÊN CỨU MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU CHO BÀI TOÁN DỰ ðOÁN RỦI RO TÍN DỤNG LUẬN VĂN THẠC SĨ Hà Nội - 2008 2 ðẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ðẠI HỌC CÔNG NGHỆ Nguyễn Văn Toàn NGHIÊN CỨU MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU CHO BÀI TOÁN DỰ ðOÁN RỦI RO TÍN DỤNG Ngành: Công nghệ thông tin Mã số: 1.01.10 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Nguyễn ðức Dũng Hà nội - 2008 8 MỤC LỤC MỞ ðẦU 5 CHƯƠNG 1 - TỔNG QUAN KHAI PHÁ TRI THỨC TỪ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 12 1.1 Giới thiệu khai phá tri thức từ dữ liệu và khai phá dữ liệu 12 1.2 Nhiệm vụ(task) khai phá dữ liệu 15 1.3 ðánh giá mô hình dự ñoán 16 1.4 Ứng dụng KDD và Datamining 18 CHƯƠNG 2 - BÀI TOÁN DỰ ðOÁN RỦI RO TÍN DỤNG 21 2.1. Bài toán dự ñoán rủi ro tín dụng 21 2.2. Thông tin về một khoản vay 22 2.2.1. Thông tin về khách hàng vay vốn 22 2.2.2. Thông tin về phương án sản xuất kinh doanh 23 2.2.3. Thông tin liên quan ñến tài sản bảo ñảm (TSBD) 24 2.2.4. Thông tin khác 24 2.3. Dữ liệu sử dụng cho bài toán 24 CHƯƠNG 3 - XỬ LÝ DỮ LIỆU DỰ ðOÁN RỦI RO TÍN DỤNG 25 3.1. Tiền xử lý dữ liệu 25 3.1.1. Công việc tiền xử lý dữ liệu 25 3.1.2. Tiền xử lý dữ liệu dự ñoán rủi ro tín dụng 30 3.2. Phương pháp lấy mẫu dữ liệu (Data sampling) 35 3.2.1. Phương pháp lấy mẫu dữ liệu 35 3.2.2. Lấy mẫu lên (Oversampling) 35 3.2.3. Lấy mẫu xuống (undersampling) 36 3.2.4. Kết hợp hai chiến lược trên 36 3.3. Hợp nhất các lớp của tập dữ liệu (Data merged) 36 CHƯƠNG 4 - DỰ ðOÁN RỦI RO TÍN DỤNG SỬ DỤNG 38 CÂY QUYẾT ðỊNH (C4.5) 38 4.1. Giới thiệu cây quyết ñịnh 38 4.1.1. Khái niệm 38 4.1.2. Các loại cây quyết ñịnh 38 4.1.3. Ví dụ thực hành 39 4.1.4. Xây dựng cây quyết ñịnh 40 4.2. Thuật toán C4.5 và ñặc ñiểm cây quyết ñịnh 41 4.2.1. Thuật toán C4.5 [17] 41 4.2.2. So sánh C4.5 với các phiên bản khác 45 4.2.3. ðặc ñiểm cây quyết ñịnh 46 4.3. Dự ñoán rủi ro tín dụng sử dụng cây quyết ñịnh (C4.5) 46 4.4. ðánh giá kết quả dự ñoán rủi ro tín dụng sử dụng cây quyết ñịnh (C4.5) 52 CHƯƠNG 5 - DỰ ðOÁN RỦI RO TÍN DỤNG SỬ DỤNG PHƯƠNG PHÁP QUY NẠP LUẬT 58 5.1. Giới thiệu 58 5.2. Thuật toán CBA 59 5.3. Dự ñoán rủi ro tín dụng bằng CBA 65 5.4. ðánh giá kết quả dự ñoán rủi ro tín dụng 67 9 CHƯƠNG 6 - DỰ ðOÁN RỦI RO TÍN DỤNG SỬ DỤNG SUPPORT VECTOR MACHINE 71 6.1. Giới thiệu Support Vector Machine 71 6.2. ðặc ñiểm của Support Vector Machine 73 6.3. Dự ñoán rủi ro tín dụng bằng Support Vector Machine 75 6.3.1. Lựa chọn tham số 75 6.3.2. Thực nghiệm với tập dữ liệu D1 76 6.3.3. Thực nghiệm với tập dữ liệu ñược hợp nhất lớp (D2) 77 6.4. ðánh giá kết quả dự ñoán rủi ro tín dụng bằng SVM 78 CHƯƠNG 7 - ðÁNH GIÁ CÁC KỸ THUẬT ðỐI VỚI BÀI TOÁN DỰ ðOÁN RỦI RO TÍN DỤNG…… ……………………………………………………………… 79 TÀI LIỆU THAM KHẢO…………………………………………………………….82 10 BẢNG CÁC TỪ VIẾT TẮT Thuật ngữ Ý nghĩa CBA Classification Based on Association – Phân loại dựa vào sự kết hợp CSDL Cơ sở dữ liệu DM Data mining (Khai phá dữ liệu) D1 Tập dữ liệu sau khi tiền xử lý D2 Tập dữ liệu hợp nhất lớp thành 02 lớp A_B và C_D_E từ tập D1 KDD Knowledge Discovery in Database (Khai phá tri thức từ dữ liệu) SVM Support Vector Machine (máy véc-tơ hỗ trợ) TSBD Tài sản bảo ñảm 11 BẢNG CÁC THUẬT NGỮ ANH-VIỆT Tiếng Anh Tiếng Việt Association Kết hợp Classification And Regression Tree – CART Cây phân lớp hồi quy Classification Phân lớp Clustering Phân cụm Classification Based on Association Phân loại dựa vào sự kết hợp Bucket Khối Data mining Khai phá dữ liệu Data cleaning Làm sạch dữ liệu Data integration Tích hợp dữ liệu Data merged Hợp nhất dữ liệu Data sampling Lẫy mẫu dữ liệu Data selection Lựa chọn dữ liệu Data transformation Biến ñổi dữ liệu Data reduction Thu gọn dữ liệu Data discretization Rời rạc hóa dữ liệu Data warehouse Kho dữ liệu Decision tree Cây quyết ñịnh Description Mô tả Estimation Ước lượng Imbalanced/Unbalanced data Dữ liệu phân bố không ñều/không cân bằng Knowledge Discovery in Data Khai phá tri thức từ dữ liệu Knowledge representation Biểu diễn tri thức Mean-squared error sai số bình phương trung bình Mean absolute error sai số tuyệt ñối trung bình Rule Induction Quy nạp luật Oversampling Lấy mẫu lên Pattern evaluation ðánh giá các mẫu Prediction Dự ñoán Prediction Model Mô hình dự báo Random oversampling Lấy mẫu lên ngẫu nhiên Relative absolute error sai số tương ñối tuyệt ñối Relative squared error Sai số bình phương tương ñối Root mean-squared error Căn bậc hai sai số bình phương trung bình Root relative squared error căn bậc hai sai số bình phương tương ñối Synthetic Minority Over- sampling Technique - SMOTE Kỹ thuật lấy mẫu lên lớp thiểu số nhân tạo Undersampling Lấy mẫu dưới 12 Chương 1 - TỔNG QUAN KHAI PHÁ TRI THỨC TỪ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1.1 Giới thiệu khai phá tri thức từ dữ liệu và khai phá dữ liệu Hiện nay có nhiều ñịnh nghĩa về khai phá dữ liệu: theo Witten [2] khai phá dữ liệu là quá trình khai phá các mẫu trong dữ liệu. Quá trình phải là tự ñộng hoặc bán tự ñộng. Các mẫu khám phá phải có ý nghĩa. Còn theo Dunham[3] thì khai phá dữ liệu là quá trình tìm kiếm thông tin ẩn chứa trong dữ liệu. Hay ñịnh nghĩa của Roiger thì khai phá dữ liệu là quá trình tận dụng một hay một số kỹ thuật học máy ñể tự ñộng phân tích và trích chọn tri thức từ dữ liệu bên trong CSDL. Tựu chung lại thì khai phá dữ liệu (DM) là phân tích tập dữ liệu quan sát lớn ñể tìm ra các mối liên hệ hiển nhiên và tổng quát hóa dữ liệu theo các cách ñể hiểu ñược và có ý nghĩa cho chính dữ liệu. DM là một quá trình khai phá các tri thức mới và các tri thức có ích ở dạng tiềm năng trong nguồn dữ liệu ñã có. DM chỉ là một bước của quá trình khai phá tri thức từ dữ liệu (KDD - Knowledge Discovery in Data Process). Quá trình KDD Quá trình khai phá tri thức từ dữ liệu bao gồm một số bước từ các bộ dữ liệu ñến tri thức mới. Quá trình này bao gồm các bước lặp như sau [4]: Hình 1.1 – Quá trình KDD. • Làm sạch dữ liệu (Data cleaning): giai ñoạn này thực hiện việc loại bỏ các dữ liệu nhiễu, dữ liệu không phù hợp khỏi bộ dữ liệu ñược sử dụng ñể khai phá tri thức. 13 • Tích hợp dữ liệu (Data integration): trong giai ñoạn này nhiều nguồn dữ liệu, thường là hỗn hợp sẽ ñược tổng hợp vào một nguồn phổ biến. • Lựa chọn dữ liệu (Data selection): trong bước này, dữ liệu không liên quan ñược phân tích ñể quyết ñịnh giữ lại hay loại bỏ khỏi tập dữ liệu. Giai ñoạn này thực hiện việc lựa chọn các trường của mỗi mẫu dữ liệu ñể thực hiện khai phá tri thức thu ñược kết quả cao. • Biến ñổi dữ liệu (Data transformation): có thể coi như hợp nhất dữ liệu, ñây là giai ñoạn mà dữ liệu ñược lựa chọn ñược biến ñổi vào các mẫu thích hợp cho quá trình khai phá. • Khai phá dữ liệu (Data mining): ñây là giai ñoạn quyết ñịnh của quá trình khai phá tri thức từ dữ liệu. Các kỹ thuật ñược sử dụng trong giai ñoạn này nhằm lấy ra các mẫu hữu ích tiềm ẩn. • ðánh giá các mẫu (Pattern evaluation): trong bước này, các mẫu biểu diễn tri thức hấp dẫn ñược nhận biết dựa trên các ñộ ño ñược ñưa ra. • Biểu diễn tri thức (Knowledge representation): là giai ñoạn cuối của quá trình khai phá tri thức từ dữ liệu, nhằm biểu diễn trực quan tri thức cho người dùng. Bước quan trọng này sử dụng các kỹ thuật trực quan ñể giúp người sử dụng hiểu và biểu diễn các kết quả khai phá dữ liệu. Thông thường một số bước ñược gộp lại với nhau. Ví dụ làm sạch dữ liệu (data cleaning) và tích hợp dữ liệu có thể ñược gộp với nhau thành giai ñoạn tiền xử lý dữ liệu (preprocessing) ñể sinh ra một kho dữ liệu (data warehouse). Lựa chọn dữ liệu (data selection) và biến ñổi dữ liệu (data transformation) có thể ñược gộp lại thành giai ñoạn hợp nhất dữ liệu, các dữ liệu ñược lựa chọn sẽ ñược biến ñổi ñể tạo thành tập dữ liệu có ñịnh dạng thống nhất. KDD là một quá trình lặp. Mỗi khi tri thức khai phá ñược biểu diễn cho người dùng, các ñộ ño ñánh giá có thể ñược nâng cao, khai phá có thể ñược cải tiến trong tương lai, dữ liệu mới có thể ñược chọn hoặc biến ñổi trong tương lai, hoặc các nguồn dữ liệu mới có thể ñược tích hợp nhằm thu ñược các kết quả khác, thích hợp hơn. Quá trình Data mining Quá trình khai phá dữ liệu chỉ là một giai ñoạn của khai phá tri thức trong CSDL. Quá trình này phải ñáng tin cậy và có thể dùng lại ñối với người dùng ít hiểu biết về Data mining. Do ñó quy trình chuẩn công nghiệp Cross cho khai phá dữ liệu (CRISP-DM: CRoss Industry Standard Process for Data mining) ñã ñược một số tổ chức, công ty (SPSS/ISL, NCR, Daimler-Benz, OHRA) hợp tác phát triển và công bố 14 năm 1996. CRISP là một tiến trình chuẩn miễn phí, ñược sử dụng ñể xử lý vấn ñề khai phá dữ liệu trong thương mại và nghiên cứu [5]. CRISP-DM là một vòng ñời bao gồm 6 giai ñoạn, ñược biểu diễn như hình sau: Hình 1.2 – Quá trình CRISP-DM. • Tìm hiểu nghiệp vụ (Business understanding): ñây là giai ñoạn ñầu tiên của quá trình chuẩn CRISP-DM, cũng có thể ñược hiểu là giai ñoạn tìm hiểu nghiên cứu.  Phát biểu các mục tiêu của dự án và các yêu cầu rõ ràng trong phạm vi yêu cầu nghiệp vụ hoặc nghiên cứu.  Biến ñổi các mục tiêu và các giới hạn vào các mẫu phát biểu ñịnh nghĩa vấn ñề của data mining. Chuẩn bị ñưa ra các chiến lược ñể ñạt ñược những mục tiêu. • Tìm hiểu dữ liệu (Data understanding): giai ñoạn này gồm các công việc chính là:  Tập hợp dữ liệu.  Sử dụng các phân tích dữ liệu mang tính thăm dò ñể hiểu dữ liệu và khai phá sự hiểu biết ban ñầu  ðánh giá chất lượng dữ liệu 15  Nếu ñược ñề nghị thì lựa chọn các tập con hấp dẫn mà có thể gồm các mẫu có thể hữu ích. • Chuẩn bị dữ liệu (Data preparation): chuẩn bị dữ liệu từ những dòng ban ñầu ñến tập dữ liệu cuối cùng ñược sử dụng trong các giai ñoạn sau. Giai ñoạn này lựa chọn các tình huống và các biến mà ta muốn phân tích mà liên quan ñến phân tích của chúng ta. Thực hiện các biến ñổi trên các biến chắc chắn, nếu cần thiết. Làm sạch các dòng dữ liệu ñã sẵn sàng cho các công cụ mô hình hóa • Mô hình hóa (Modeling): giai ñoạn này bao gồm các công việc chính là:  Lựa chọn và sử dụng các kỹ thuật mô hình hóa phù hợp.  Chỉnh sửa các thiết lập mô hình ñể tối ưu các kết quả.  Nếu cần thiết, lặp lại giai ñoạn chuẩn bị dữ liệu (preparation) ñể lấy các mẫu của dữ liệu vào các yêu cầu cụ thể của một kỹ thuật khai phá dữ liệu. • ðánh giá (Evaluation): ðánh giá chất lượng và hiệu lực của một hoặc nhiều mô hình ñược thực hiện trong giai ñoạn mô hình hóa trước khi triển khai chúng cho sử dụng trong thực tế. Xác ñịnh mô hình thực tế ñã thu ñược tập mục tiêu ở giai ñoạn ñầu tiên hay chưa. ðưa vào một số khía cạnh quan trọng của vấn ñề nghiệp vụ hoặc nghiên cứu mà chưa thu ñược thích ñáng. ði ñến các quyết ñịnh sử dụng các kết quả khai phá dữ liệu. • Triển khai (Deployment): Sử dụng các mô hình ñã tạo: Tạo các mô hình không có nghĩa là hoàn thành dự án. Thí ñiểm một triển khai ñơn giản: sinh ra báo cáo. Thí ñiểm triển khai phức tạp hơn: thực hiện quá trì khai phá dữ liệu song song trong bộ phận khác. 1.2 Nhiệm vụ(task) khai phá dữ liệu Một số bài toán chính mà khai phá dữ liệu thường thực hiện là [6]: • Mô tả (Description) • Ước lượng (Estimation) • Dự ñoán (Prediction) • Phân lớp (Classification) • Phân cụm (Clustering) • Kết hợp (Association) Bài toán thông dụng nhất trong KPDL là Phân lớp (Classification). Với một tập các dữ liệu huấn luyện cho trước và sự huấn luyện của con người, các giải thuật phân loại sẽ học ra bộ phân loại (classifier) dùng ñể phân các dữ liệu mới vào một trong [...]... c a bài toán s là d li u không cân b ng (imbalanced data) Bài toán d ñoán r i ro tín d ng ph i x lý trên t p d li u không cân b ng Nên vi c áp d ng các k thu t khai phá d li u cho bài toán c n xem xét ñ n khía c nh d li u không cân b ng 25 Chương 3 - X LÝ D LI U D ðOÁN R I RO TÍN D NG 3.1 Ti n x lý d li u D li u ñư c s d ng ñ khai phá d li u thư ng ñư c l y t nhi u ngu n khác nhau; ñư c lưu tr trong... 2 - BÀI TOÁN D ðOÁN R I RO TÍN D NG 2.1 Bài toán d ñoán r i ro tín d ng R i ro tín d ng có th ñư c hi u là nguy cơ m t ngư i ñi vay không th tr ñư c g c và/ho c lãi ñúng th i h n quy ñ nh (v n ) Hi n nay, các ngân hàng thương m i s d ng khái ni m nhóm n ñ phân lo i m c ñ r i ro và trích l p d phòng r i ro cho các kho n vay Theo quy ñ nh phân lo i n hi n hành c a Ngân hàng Nhà Nư c (NHNN): T ch c tín. .. u/thu c tính Cô ñ ng d li u R i r c hóa (Discretization) • Data discretization và concept hierarchy 30 - Chuy n d li u s (liên t c) thành các giá tr rõ ràng - M t s thu t toán data mining ch ch p nh n các giá tr rõ ràng 3.1.2 Ti n x lý d li u d ñoán r i ro tín d ng Trong lu n văn này, tôi s d ng ph n m m Weka 3.5.8 ñ th c hi n vi c x lý d li u cho bài toán d ñoán r i ro tín d ng T p d li u c a bài toán. .. m ña s Hi n nay, có nhi u nghiên c u v các phương pháp l y m u cho các k thu t khai phá d li u trên t p d li u không cân b ng ñ thu ñư c k t qu t t hơn Các k thu t phân lo i như m ng neural, SVM và C4.5 ñư c nghiên c u trong nhi u bài báo cho v n ñ d li u phân b không ñ ng ñ u Các gi i pháp cho v n ñ d li u không ñ ng ñ u c a các l p ñư c ñưa ra c m c d li u và m c thu t toán Có ba chi n lư c l y m... • Outliers, • D li u trong m t bi u m u không thích h p cho các mô hình khai phá d li u, • Các giá tr không phù h p v i chính sách ho c ý nghĩa thông thư ng Trong khi ñó, ch t lư ng d li u là chìa khóa thành công c a khai phá d li u Vì v y ñ nâng cao ñ chính xác c a khai phá d li u, chúng ta ph i th c hi n ti n x lý d li u nh m tăng ch t lư ng c a d li u ph c v công vi c khai phá Dorian Pyle ñã ñưa... s b nh nhân huy t áp cao trong b nh vi n d a vào ñ tu i, gi i tính, … Quan h gi a b nh nhân huy t áp cao và các bi n d ñoán trong t p hu n luy n s cung c p cho ta mô hình ư c lư ng Chúng ta có th s d ng mô hình này cho các trư ng h p m i D ñoán (Prediction): Tương t như phân l p và ư c lư ng Tuy nhiên d ñoán ñưa ra k t qu là trong tương lai Bài toán d ñoán r i ro tín d ng trong lu n văn là m t ví d... • ROC Area: di n tích c a vùng ROC (Receiver Operating Characteristic) 1.4 ng d ng KDD và Datamining Khai phá d li u ñư c ng d ng trong nhi u lĩnh v c khoa h c khác nhau nh m khai thác ngu n d li u phong phú ñư c lưu tr trong các h th ng thông tin Tùy theo b n ch t c a t ng lĩnh v c, vi c v n d ng khai phá d li u có nh ng cách ti p c n khác nhau DM cũng ñư c v n d ng hi u qu ñ gi i quy t các bài toán. .. ñư c áp d ng cho 19 các v n ñ xã h i như phát hi n t i ph m hay tăng cư ng an ninh xã h i Vi c v n d ng thành công ñã mang l i nh ng hi u qu thi t th c cho các ho t ñ ng di n ra hàng ngày trong ñ i s ng [11] Trong lĩnh v c tài chính ngân hàng, data mining ñư c ng d ng cho các phân tích r i ro tín d ng, phát hi n gian l n, ti p th , quan h khách hàng, d báo t giá ngo i t , qu n lý r i ro tác nghi p,... trư ng, trong ñó trư ng ch báo n là thu c tính c n d ñoán Thu c tính th i h n kho n vay có giá tr là s như: 1 tháng, 2 tháng, 3 tháng,… Như v y, thu c tính s ch a r t nhi u giá tr s khác nhau ði u này làm nh hư ng ñ n ch t lư ng d li u và k t qu khai phá d li u ð không làm nh hư ng ñ n k t qu khai phá d li u và không làm thay ñ i b n ch t c a d li u trong ho t ñ ng kinh doanh c a ngân hàng trong th... thu c tính v i thu c tính khác) • Bi n ñ i d li u - Ph m v các giá tr c a các thu c tính (ñ c tính) khác nhau, d n ñ n m t thu c tính có th áp ñ o thu c tính khác - Gi i pháp: chu n hóa như chia t l các giá tr d li u trong m t dãy như [0 1], [-1 1] ngăn c n các thu c có nhi u giá tr hơn v i m t ph m vi l n ví d “lương” có ph m vi d li u l n hơn nhi u so v i các thu c tính như “tu i” M t s phương pháp . THỨC TỪ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1.1 Giới thiệu khai phá tri thức từ dữ liệu và khai phá dữ liệu Hiện nay có nhiều ñịnh nghĩa về khai phá dữ liệu: theo Witten [2] khai phá dữ liệu là quá. 2.3. Dữ liệu sử dụng cho bài toán 24 CHƯƠNG 3 - XỬ LÝ DỮ LIỆU DỰ ðOÁN RỦI RO TÍN DỤNG 25 3.1. Tiền xử lý dữ liệu 25 3.1.1. Công việc tiền xử lý dữ liệu 25 3.1.2. Tiền xử lý dữ liệu dự ñoán rủi. QUAN KHAI PHÁ TRI THỨC TỪ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 12 1.1 Giới thiệu khai phá tri thức từ dữ liệu và khai phá dữ liệu 12 1.2 Nhiệm vụ(task) khai phá dữ liệu 15 1.3 ðánh giá mô hình dự ñoán
- Xem thêm -

Xem thêm: Nghiên cứu một số kỹ thuật khai phá dữ liệu cho bài toán dự đoán rủi ro tín dụng, Nghiên cứu một số kỹ thuật khai phá dữ liệu cho bài toán dự đoán rủi ro tín dụng, Nghiên cứu một số kỹ thuật khai phá dữ liệu cho bài toán dự đoán rủi ro tín dụng, Chương 1. Tổng quan khai phá tri thức từ dữ liệu và khai phá dữ liệu, 2 Nhiệm vụ (task) khai phá dữ liệu, Chương 2. Bài toán dự đoán rủi ro tín dụng, Chương 3. Xử lý dữ liệu dự đoán rủi ro tín dụng, 1 Tiền xử lý dữ liệu, Chương 4. Dự đoán rủi ro tín dụng sử dụng cây quyết định (C4.5), 1 Giới thiệu cây quyết định, Chương 5. Dự đoán rủi ro tín dụng sử dụng phương pháp quy nạp luật, 4 Đánh giá kết quả dự đoán rủi ro tín dụng, Chương 6. Dự đoán rủi ro tín dụng sử dụng Support vector machine, 3 Dự đoán rủi ro tín dụng bằng support vector machine, 4 Đánh giá kết quả dự đoán rủi ro tín dụng bằng SVM, Tài liệu tham khảo

Từ khóa liên quan

Mục lục

Xem thêm

Gợi ý tài liệu liên quan cho bạn