... trong khai phá dữ liệu. Do đó quy trình xử lý dữ liệu được thể hiện như sau: 1. Nguồn dữ liệu: Nguồn dữ liệu bao gồm tập dữ liệu với rất nhiều các định dạng giúp người sử dụng dễ dàng đưa dữ liệu ... SQL, Nguồn dữ liệu hay còn gọi là dữ liệu thô nghĩa là dữ liệu chưa qua quá trình tinh chỉnh, là nguồn dữ liệu gốc, nguồn dữ liệu ban đầu. 2. Trích chọn dữ liệu: Chọn nguồn dữ liệu phù hợp ... trình làm sạch dữ liệu (xử lý với dữ liệu không đầy đủ, dữ liệu nhiễu, dữ liệu không nhất quán, .v.v.), rút gọn dữ liệu (sử dụng hàm nhóm và tính tổng, các phương pháp nén dữ liệu, sử dụng histograms,...