... nghiệm Weka Tiền xử lý dư liệu - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) ... Lọc mẫu (instances, patterns) liệu cho mô hình o Clean data: Làm liệu xóa bỏliệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ... hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu _ Khởi động Weka explorer Open file, chọn kiểu dư ...
... dưa chuột với loại BR sau xử lý chúng với nhiều loại thuốc trừ sâu, bao gồm chloropyrifos (CPF), loại thuốc trừ sâu thương mại có phổ tác dụng rộng Kết cho thấy BR làm giảm đáng kể độc tính loại ... Các nhà khoa học phát hormone tự nhiên giúp thực vật tự loạibỏdư lượng số thuốc trừ sâu Jing Quan Yu cộng lưu ý loại thuốc trừ sâu có vai trò quan trọng việc trì sản lượng lương ... giới sử dụng khoảng 2,5 tỉ thuốc trừ sâu năm Các nhà khoa học tìm kiếm biện pháp làm giảm thiểu dư lượng thuốc trừ sâu trì nông sản sau thu hoạch chưa đạt thành công đáng kể Một nghiên cứu trước...
... thi hệ thống tự động gán cho tài liệu văn loại 2.2 Tiến trình phân loại văn Đưa tập tài liệu mẫu D, cần phân bổ thành số loại tài liệu định - tài liệucần gán cho loại văn Nhiệm vụ tìm hệ thống ... liệu Tiền xử lý liệu Biến đổi liệu Khai phá liệu Đánh giá biểu diễn tri thức 1.2 Khai phá liệu văn - Khai phá liệu văn việc trích ra, lấy thông tin có ích, chưa biết đến tiềm ẩn kho liệu ... yêu cầu trước tiên phải tiến hành phân loại văn 2.1.2 Định nghĩa phân loại văn Phân loại văn phân loại không cấu trúc tài liệu văn dựa tập hợp hay nhiều loại văn định nghĩa trước Quá trình thường...
... triển thành viên diễn đàn XDA Thông thường bạn muốn có lưu đầy đủ điện thoại Android sử dụng, bạn cần phải đảm bảo điện thoại có quyền root sau dùng phần mềm bên thứ ba để thực điều Nhưng tất người ... thoại Android Người dùng có quyền lựa tạo lưu có phần mềm kèm theo Quá trình để có lưu đơn giản, cần kết nối điện thoại cáp USB kích hoạt chế độ gỡ rối USB điện thoại bạn Sau kết nối thành công...
... thi hệ thống tự động gán cho tài liệu văn loại 2.2 Tiến trình phân loại văn Đưa tập tài liệu mẫu D, cần phân bổ thành số loại tài liệu định - tài liệucần gán cho loại văn Nhiệm vụ tìm hệ thống ... liệu Tiền xử lý liệu Biến đổi liệu Khai phá liệu Đánh giá biểu diễn tri thức 1.2 Khai phá liệu văn - Khai phá liệu văn việc trích ra, lấy thông tin có ích, chưa biết đến tiềm ẩn kho liệu ... yêu cầu trước tiên phải tiến hành phân loại văn 2.1.2 Định nghĩa phân loại văn Phân loại văn phân loại không cấu trúc tài liệu văn dựa tập hợp hay nhiều loại văn định nghĩa trước Quá trình thường...
... không mát Trong nén mát, liệu mát liệudư thừa, liệu thường mắt người có khả cảm nhận Dữliệudưthừa chia làm loại chính: dưthừa khả nhận thức (perceptual redundancies), dưthừa mặt không gian (spatial ... khối tính sai khác Sau có liệu trạng thái khối sai khác, giai đoạn mã hóa thực thi việc nén liệu dựa loạibỏloạidư thừa: dưthừa nhận thức, dưthừa mặt không gian dưthừa mặt thống kê mã hóa ... khung hình đầu Do đó, liệucần thiết để mã hóa bao gồm vị trí hay liệu chuyển động người khung hình 2.2 Các kỹ thuật loạibỏdưthừa mặt thời gian Trong nén video việc loạibỏdưthừa mặt thời gian...
... dưthừa thời gian có tỷ lệ nén cao PSNR có nhiều dưthừaloạibỏ có khả khôi phục tốt hơn (dư thừa mặt thời gian) Những kỹ thuật loạibỏ nhiều dưthừa có tỷ lệ nén cao PSNR Độ phức tạp Bảng 3.4: ... MJPEG không loạibỏdưthừa mặt thời gian nên kết video sau giải mã chịu ảnh hưởng lượng tử hóa Tuy nhiên, so sánh số PSNR, MJPEG có tỷ lệ nén thấp Các mã hóa có kỹ thuật loạibỏdưthừa thời gian ... ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠIBỎ 2.1 Dưthừa mặt thời gian 2.2 Các kỹ thuật loạibỏdưthừa mặt thời gian 2.2.1 Dự đoán khung hình liền kề...
... không mát Trong nén mát, liệu mát liệudư thừa, liệu thường mắt người có khả cảm nhận Dữliệudưthừa chia làm loại chính: dưthừa khả nhận thức (perceptual redundancies), dưthừa mặt không gian (spatial ... dưthừa thời gian, kỹ thuật loạibỏdưthừa mặt thời gian sử dụng Tiếp đó, học viên phân tích điểm mạnh yếu kỹ thuật loạibỏdưthừa mặt thời gian Qua đó, học viên đề xuất phương án loạibỏliệu ... khối tính sai khác Sau có liệu trạng thái khối sai khác, giai đoạn mã hóa thực thi việc nén liệu dựa loạibỏloạidư thừa: dưthừa nhận thức, dưthừa mặt không gian dưthừa mặt thống kê mã hóa...
... diễn cách phát bế tắc có tính chất động, điều dẫn đến hủy bỏ giao dịch III CÁC THUẬT TOÁN ĐẢM BẢO SỰ GẮN BÓDỮLIỆU TRONG CÁC CƠ SỞ DỮLIỆU PHÂN TÁN III.1 Thuật toán cung cấp: Vì ổn định hiệu ... đảm dư liệu sẽ được ghi lên đúng đắn lên mọi sở dư liệu, đòi hỏi phải có các chế bảo vệ dư liệu Ví dụ việc cập nhật bảng cân đối tài khoản khách hàng ở ba sở dư ... Xử lý cố trạm Nếu dư liệu được phân tán nhiều server, để bảo đảm dư liệu sẽ được ghi lên đúng đắn lên mọi sở dư liệu, đòi hỏi phải có các chế bảo vệ dư liệu Ví dụ...
... dễ dàng Trên thực tế liệu DNS chứa máy chủ Zone thực tế liệu DNS liệu Zone Các dạng Zone 2.1 Primary Zone Một máy chủ chứa liệu Primary Zone máy chủ toàn quyền việc update liệu Zone 2.2 Secondary ... Primary Zone, chứa liệu Zone nên cung cấp khả resolution cho máy có yêu cầu Muốn cập nhật liệu Zone phải đồng với máy chủ Primary 2.3 Stub Zone 38 Dữliệu Stub Zone bao gồm liệu NS Record máy ... trò đáp trả trình tự động để sửa lỗi (phantom) bên sở liệu Active Directory Phantom tạo DC, yêu cầu tham chiếu chéo sở liệu đối tượng bên sở liệu riêng đối tượng từ miền bên forest Ví dụ bắt gặp...
... với mẫu liệu Tic Tac Toe.arff Test set Dữliệu xây dựng mô hình Dữliệu để xây dựng mô hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp (categorical attribute) Dữliệu gốc ... thuộc tính tập liệu có kiểu liệu rời rạc Bài toán phân lớp - Phân lớp theo tình trạng nước cờ, có trạng thái Positive (thuận lợi) Negative( bất lợi) Giải toán sử dụng phân lớp Xử lý liệu đầu vào: ... DecisionStump RandomTree REPTree RandomForest Thực nghiệm Dữliệu chia làm 10 Folds trình Train/Test Model thực lặp lại 10 lần Tại lần Train/Test Model, phần liệu dùng để Test phần lại dùng để Train Sử dụng...
... khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mô hình khai phá liệu (data ... LoaiGame ThuPhi CauHinh NhaPhatHanh Trong gói liệu ,thuộc tính “STT” biểu thị số thứ tự , không cần thiết cho trình khai phá liệu nên ta loạibỏ , bước loạibỏ sau : Trong panel Filter > Choose > filters ... Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ordinal o Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như...
... thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original ... Lọc mẫu (instances, patterns) liệu cho mô hình • Clean data: Làm liệu xóa bỏliệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ... Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu 2- Tiền xử lí liệu với toán chọn - Trong...
... -Cây định -95% liệu để xây dựng, 5% liệu test 2011 Meta Data -90% d liệu ểxâydựng, 10% d liệu test -85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 ... 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data -50% d liệu ểxâydựng, 50% d liệu test 2011 Meta Data ... iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka 2011 Meta Data -Sử dụng toàn liệu để training 2011 Meta Data -Nội dung kếtquả === Classifier model (full...
... Vũ Tuấn Anh- Khai phá liệu -85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% test ... Khai phá liệu a b c d < classified as 28 0 | a = van 19 0 | b = saab 0 26 | c = bus 16 | d = opel -Câyquyếtđịnh: -95% d liệu ểxâydựng, 5% test 11 11/2011 Vũ Tuấn Anh- Khai phá liệu -90% d liệu ểxâydựng, ... -Training data 11/2011 Vũ Tuấn Anh- Khai phá liệu 3.Tiến hành Weka -Đưa liệu vào Weka -Sử dụng toàn liệu để Training: 11/2011 Vũ Tuấn Anh- Khai phá liệu *Nội dung kếtquả === Run information ===...
... luật kết hợp không làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka la file ARFF (Attribute ... tương ứng 2.1 Lọc thuộc tính (Filtering Attributes) Trong file liệu bank-data.csv, khách hàng xác định thuộc tính id Chúng ta cầnloạibỏ thuộc tính trước thực bước Association Rule Mining Công việc ... relation) với 11 thuộc tính sau loạibỏ thuộc tính id Bạn thực việc lọc nhiều thuộc tính khác tùy theo ứng dụng bạn theo cách Bây ta lưu lại liệu sau loạibỏ thuộc tính id dạng file arff với...
... trình thực huấn luyện phân lớp với mẫu liệu machine.arff Dữliệu để xây dựng mô hình: + Dữliệu gốc (original dataset) tập liệu file machine.arff + Dữliệu phải có thuộc tính phân lớp (categorical ... khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc ordinal data) áp dụng (thích hợp) với mô hình khai phá liệu (data ... chuỗi ký tự không phù hợp cho việc phân lớp ta cầnloạibỏ thuộc tính o Lọc mẫu làm liệu: ta thấy dataset giá trị sai lêch ta không cần lọc bổ mẫu làm liệu Vũ Trung Kiên – Lớp CNPM – Sử dụng weka...
... WrapperSubsetEval, mục Classifier chọn NaiveBayes hình sau Page KHAI PHÁ DỮLIỆU Trong mục Search Method chọn GredySteepWise Thu kết Page KHAI PHÁ DỮLIỆU === Run information === Evaluator: weka.attributeSelection.WrapperSubsetEval ... goiter, T3_measured, T3, TT4_measured, T4U_measured, FTI, TBG_measured 4.Tiền xử lý liệuLoạibỏ thuộc tính không cần thiết sau trích chọn thuộc tính query_on_thyroxine, on_antithyroid_medication, ... KHAI PHÁ DỮLIỆU === Confusion Matrix === a b < classified as 126 26 | a = sick-euthyroid 16 1413 | b = negative 3.Kết luân Sau lần chạy thử , ta rút kết luận lần chạy thử với liệu: 66% liệu dùng...
... tài (identifying frauds); • WWW: Phân loại tài liệu (document classification); phân loại người dùng web (clustering weblog);… Các kỹ thuật phân cụm phân loại sau (xem hình) Thuật Toán K-Means ... biển Training set : gồm 783 mẫu liệu Testing set : gồm 178080 mẫu dựliệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised ... 10.000km, từ bờ biển Nam Mỹ đến quần đảo Macsan, Marudơ khu vực Thái Bình Dư ng El-Nino thường gắn với trình lớn khí - đại dư ng dao động Nam bán cầu gọi chung ENSO Hiện tượng El-Nino thường lặp...