... 6
Tiểu luận Kho dữ liệu và khai phá dữ liệu 2011
- Mở lại file arrf vừa chỉnh sửa bằng Weka Explorer
Hoàng Văn Tiến – CNPM 6 7
Tiểu luận Kho dữ liệu và khai phá dữ liệu 2011
3. Phân lớp dữ liệu
Dữ ... Tiểu luận Kho dữ liệu và khai phá dữ liệu 2011
Học viện kỹ thuật quân sự
Khoa công nghệ thông tin
~ * ~
TIỂU LUẬN
KHO DỮ LIỆU VÀ KHAI PHÁ D...
... THÔNG TIN
oOo
MÔN: KHAI PHÁ DỮ LIỆU
TIỂU LUẬN: SỬ DỤNG WEKA VỚI CSDL SEGMENT TEST ÁP
DỤNG THUẬT TOÁN PHÂN CỤM REPTree
SV thực hiện: Nguyễn Thị Hồng
Lớp: CNPM6
Giảng viên HD: Hồ Nhật Quang
... lý dữ liệu
- Trong qui trình khai phá dữ liệu, công việc xử lý dữ liệu trước khi đưa
vào các mô hình là rất cần thiết, bước này làm cho dữ liệu có được
ban đầu qua thu thập...
... Họ và tên: Nguyễn Thị Phượng
Lớp hệ thống thông tin 6
Sử dụng weka để phân lớp trên Dataset SpamBase
Contents
Họ và tên: Nguyễn Thị Phượng 1
Sử dụng weka để phân lớp trên Dataset SpamBase ... tính:
1.word_freq_make
2.word_freq_address
3.word_freq_all
4.word_freq_3d
5.word_freq_our
6.word_freq_over
7.word_freq_remove
8.word_freq_internet
9.word_freq_order
10.word_freq_mail...
... tree"
)DA.A5
• Tiến hành chạy thử nhiều lần cây trên số lượng dữ liệu trainning khác nhau:
h Lần thứ 2: Lấy 95% dữ liệu để xây dựng cây, 5% để test
ZZZƒ?&ZZZ
f;;I<;?;&&;;‹aˆh[U_ch]_
ƒ;I?Ph<;?;&;&7;& ... '&
30. &I]Q)...
... – Khai phá dữ liệu
2011
-90% d liệu ểxâydựng, 10% d liệu test
10
Phạm Trung Kiên – Khai phá dữ liệu
2011
-85% d liệu ểxâydựng, 15% d liệu test
11
Phạm Trung Kiên – Khai phá dữ liệu
2011
-70% d liệu ểxâydựng, ... d liệu ểxâydựng, 30% d liệu test
12
Phạm Trung Kiên – Khai phá dữ liệu
2011
-50% d liệu ểxâydựng, 50% d liệu test
13
Phạm Trung Kiên – Khai phá...
... thường. Weka cung cấp cho ta chức năng filter những giá trị lỗi đ :
Với dữ liệu Balloons DataSet
Ta có thể xem dữ liệu 1 cách trực quan như trên hoặc mở file dữ liệu bằng cách
chọn nút Edit
Do dữ liệu ... Train và Test một classifier
- Dữ liệu để xây dựng mô hình: dữ liệu gốc (original dataset) , dữ liệu
này phải có thuộc tính phân lớp gọi là categoric...
... Nguyễn Thị Hoa Trang 12
Khai phá dữ liệu GVHD: Hồ Nhật Quang
SVTH: Nguyễn Thị Hoa Trang 13
Khai phá dữ liệu GVHD: Hồ Nhật Quang
b. Phương pháp Percentage split: Cho biết tỉ lệ phân chia là bao nhiêu ... hóa dữ liệu thì được bảng
dữ liệu chỉ toàn kiểu Nominal, vì vậy ta sử dụng thuật toán J48 để đạt hiệu quả phân lớp cao.
Sử dụng thuật toán với phần...
... TIN
oOo
MÔN: KHAI PHÁ DỮ LIỆU
TIỂU LUẬN: Sử dụng weka để phân lớp trên dataset
Billionaires92
SỬ DỤNG WEKA VỚI CSDL SEGMENT TEST ÁP DỤNG THUẬT
TOÁN PHÂN CỤM REPTree
SV thực hiện: Nguyễn Thị ... xuất hiện cây như sau:
Sử dụng Weka để phân lớp trên dataset
1. Lý thuyết về phân lớp:
Trong lĩnh vực máy học (machine Learning) và nhận dạng (pattern
recognition) , b...