Nghiên cứu phương pháp lọc spam và ứng dụng trong bảo mật hệ thống thư điện tử tại sở thông tin và truyền thông tỉnh nam định

79 904 3
Nghiên cứu phương pháp lọc spam và ứng dụng trong bảo mật hệ thống thư điện tử tại sở thông tin và truyền thông tỉnh nam định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐINH QUANG THÁI NGHIÊN CỨU PHƯƠNG PHÁP LỌC SPAM VÀ ỨNG DỤNG TRONG BẢO MẬT HỆ THỐNG THƯ ĐIỆN TỬ TẠI SỞ THÔNG TIN VÀ TRUYỀN THÔNG TỈNH NAM ĐỊNH Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS Nguyễn Ngọc Cương Thái Nguyên - 2013 i LỜI CAM ĐOAN Tôi xin cam đoan rằng, công trình nghiên cứu tơi có giúp đỡ tận tình thầy hướng dẫn thầy cô Học viện An ninh nhân dân, hỗ trợ đồng nghiệp Sở Thông tin Truyền thông Nam Định Các nội dung nghiên cứu kết đề tài hoàn toàn trung thực Trong luận văn, tơi có tham khảo đến số tài liệu số tác giả liệt kê phần Tài liệu tham khảo cuối luận văn Thái Nguyên, ngày 15 tháng năm 2013 Tác giả ĐINH QUANG THÁI ii LỜI CẢM ƠN Để hồn thành chương trình Cao học viết luận văn này, nhận hướng dẫn, giúp đỡ góp ý nhiệt tình q thầy trường Đại học Công nghệ Thông tin Truyền thông Thái Nguyên Trước hết, xin chân thành cảm ơn đến quý thầy cô trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên, thầy cô Học viện An ninh nhân dân, đặc biệt thầy tận tình dạy bảo cho tơi suốt thời gian học tập trường Tôi xin gửi lời biết ơn sâu sắc đến Tiến sĩ Nguyễn Ngọc Cương - Học viện An ninh nhân dân dành nhiều thời gian tâm huyết hướng dẫn nghiên cứu giúp tơi hồn thành luận văn tốt nghiệp Nhân đây, xin chân thành cảm ơn Ban giám hiệu trường Đại học Công nghệ Thông tin Truyền thông tạo nhiều điều kiện để học tập hồn thành tốt khóa học Mặc dù tơi có nhiều cố gắng hồn thiện luận văn tất nhiệt tình lực mình, nhiên khơng thể tránh khỏi thiếu sót, tơi mong nhận đóng góp q báu quý thầy cô bạn Lời cảm ơn sau tơi xin dành cho gia đình người bạn hết lòng quan tâm tạo điều kiện tốt để tơi hồn thành luận văn tốt nghiệp này! Tôi xin chân thành cảm ơn! Thái Nguyên, ngày 15 tháng năm 2013 Học viên thực Đinh Quang Thái - Lớp CK10A Trường Đại học CNTT&TT – Đại học Thái Nguyên iii MỤC LỤC LỜI CAM ĐOAN .i LỜI CẢM ƠN ii DANH MỤC CÁC HÌNH .v DANH MỤC CÁC BẢNG vii DANH MỤC TỪ VIẾT TẮT .viii MỞ ĐẦU Chương 1: TỔNG QUAN VỀ THƯ ĐIỆN TỬ VÀ SPAM 1.1 Các khái niệm 1.1.1 Thư điện tử gì? .3 1.1.2 Cấu trúc chung địa thư điện tử 1.1.3 Sự khác biệt thư điện tử với thư bưu 1.1.4 Thư rác gì? 1.1.5 Các loại thư rác 1.1.6 Tác hại thư rác .6 1.2 Phương thức trao đổi thông tin qua dịch vụ Email 1.2.1 Mô hình trao đổi thơng tin dựa email 1.2.2 Giao thức ngôn ngữ sử dụng 1.3 Các phần mềm lọc nội dung mail nước 11 Chương 2: CÁC PHƯƠNG PHÁP GỬI VÀ KỸ THUẬT LỌC EMAIL SPAM 14 2.1 Các kỹ thuật gửi mail nặc danh Bomb Mail .14 2.1.1 Thu thập địa email 14 2.1.2 Tìm kiếm máy tính Internet cho phép gửi thư 17 2.1.3 Boml Mail 19 2.2 Mô hình nguyên lý hoạt động hệ thống lọc nội dung Mail 21 2.2.1 Mơ hình hệ thống lọc mail .21 2.2.2 Kiến trúc tổng quan hệ thống lọc mail .23 2.2.3 Các kỹ thuật lọc nội dung thông tin qua mail 25 2.2.4 Kỹ thuật lọc Spam 28 Chương 3: XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM VÀ ĐỀ XUẤT CÁC GIẢI PHÁP PHÒNG CHỐNG SPAM 42 3.1 Xây dựng chương trình lọc spam cho ứng dụng thư điện tử 42 3.1.1 Nhiệm vụ chương trình 42 3.1.2 Các công nghệ sử dụng 42 3.1.3 Các chức chương trình 43 iv 3.2 Thử nghiệm hệ thống thư điện tử Sở Thông tin Truyền thông tỉnh Nam Định 44 3.2.1 Khảo sát việc sử dụng mail Sở Thông tin Truyền thông tỉnh Nam Định 44 3.2.2 Dữ liệu thử nghiệm 45 3.2.3 Phương pháp thử nghiệm 46 3.2.4 Thử nghiệm chương trình 47 3.2.4 So sánh phương pháp phân loại 53 3.2.5 Lựa chọn độ dài số lượng đặc trưng 54 3.2.6 Phân biệt theo ngôn ngữ trước lọc .56 3.2.7 Nhận xét kết thử nghiệm 56 3.3 Đề xuất giải pháp phòng chống spam .57 3.3.1 Giải pháp phòng chống mail server .57 3.3.2 Giải pháp phòng chống mail client 62 3.3.3 Giải pháp phía người sử dụng mail 65 KẾT LUẬN CHUNG 67 TÀI LIỆU THAM KHẢO .68 v DANH MỤC CÁC HÌNH Hình 1.1: Mơ hình lưu chuyển thư điện tử qua Internet Hình 1.2: Mơ hình gửi nhận thư điện tử sử dụng giao thử SMTP 10 Hình 1.3: Mơ hình gửi nhận thư điện tử dùng giao thức IMAP POP 10 Hình 1.4: Phần mềm lọc nội dung mail 11 Hình 2.1: Ví dụ trang web lấy cắp địa email người dùng 15 Hình 2.2: Một số website cơng ty gửi thư rác 17 Hình 2.3: Minh họa cách gửi thư rác qua mail server (open relay) .18 Hình 2.4: Các phương án trí hệ thống lọc thư 22 Hình 2.5: Kiến trúc chung hệ thống lọc thư 24 Hình 2.6: Mơ hình tổng quát lọc thư rác Tiếng Việt .28 Hình 2.7: Lưu lượng thư mơi trường SPF 32 Hình 2.8: Cách thức làm việc SPF 33 Hình 2.9: Lọc thư rác phương pháp chặn IP 34 Hình 2.10: Thơng tin header email 40 Hình 3.1: Nhiệm vụ chương trình lọc thư rác 42 Hình 3.2: Chức phần mềm lọc thư rác 44 Hình 3.3: Giao diện form thiết lập thông số huấn luyện hệ thống 47 Hình 3.4: Lựa chọn thư mục chứa thư mẫu cho việc huấn luyện 48 Hình 3.5: Giao diện form tiến hành huấn luyện tập mẫu thư thường .48 Hình 3.6: Giao diện thiết lập danh sách hòm thư cần chặn lọc .49 Hình 3.7: Cửa sổ xác nhận việc cập nhật danh sách hịm thư cần chặn lọc 49 Hình 3.8: Giao diện thiết lập từ khóa cần chặn lọc .50 Hình 3.9: Cửa sổ xác nhận việc cập nhật danh sách từ khóa cần chặn lọc 50 Hình 3.10: Xác nhận sử dụng tính lọc thư rác chương trình 51 Hình 3.11: Hịm thư chưa chạy chương trình lọc thư rác 51 vi Hình 3.12: Thống kê kết lọc thư rác chương trình 51 Hình 3.13: Thư rác đánh dấu trình xem thư Outlook .52 Hình 3.14: Giao diện tab giới thiệu chương trình 52 Hình 3.15: Xác nhận việc khỏi chương trình .53 Hình 3.16: Độ xác phân loại chung với số lượng đặc trưng khác 55 Hình 3.17: Độ xác phân loại với quy trình lọc khác .57 Hình 3.18: Phương thức hoạt động SPF 58 Hình 3.19: Phương thức hoạt động SPF động 60 Hình 3.20: Phân bố số lượng cặp (tên miền, IP) theo thơi gian 61 Hình 3.21: Hiệu phương pháp SPF động 62 vii DANH MỤC CÁC BẢNG Bảng 1.1: So sánh thư điện tử thư truyền thống Bảng 1.2: Thống kê dạng thư rác máy chủ Bảng 3.1 Bộ liệu thử nghiệm 46 Bảng 3.2 Độ xác phân loại với phương pháp phân loại khác nhau53 Bảng 3.3 Kết phân loại với độ dài đặc trưng - từ khác 55 Bảng 3.4 : Bảng liệu mẫu sử dụng phương pháp SPF động .61 viii DANH MỤC TỪ VIẾT TẮT SPAM: Thư rác EMAIL: Thư điện tử SMTP: Simple Mail Transfer Protocol IMAP: Internet Message Access Protocol POP: Post Office Protocol MỞ ĐẦU Thư rác (spam) thư điện tử gửi hàng loạt với nội dung mà người nhận không mong đợi, không muốn xem, hay chứa nội dung không liên quan đến người nhận thường sử dụng để gửi thơng tin quảng cáo Do có giá thành tương đối thấp so với phương pháp quảng cáo khác, thư rác chiếm tỷ lệ lớn ngày tăng tổng số thư điện tử gửi qua Internet Sự xuất gia tăng thư rác khơng gây khó chịu làm thời gian người nhận mà ảnh hưởng tới đường truyền Internet làm chậm tốc độ xử lý máy chủ thư điện tử, gây thiệt hại lớn kinh tế Để loại bỏ giảm thiểu ảnh hưởng thư rác, nhiều cách tiếp cận khác nghiên cứu sử dụng Giải pháp đấu tranh với thư rác đa dạng, bao gồm từ cố gắng pháp lý việc xây dựng luật ngăn chặn phát tán thư rác giải pháp kỹ thuật nhằm phát ngăn chặn thư rác giai đoạn khác trình tạo phát tán thư Trong số giải pháp sử dụng, lọc thư theo nội dung giải pháp sử dụng rộng rãi có triển vọng Lọc thư theo nội dung phương pháp phân tích nội dung thư để phân biệt thư rác với thư bình thường, kết phân tích sau sử dụng để định chuyển tiếp thư đến người nhận hay không (trong phạm vi nghiên cứu này, nội dung thư giới hạn nội dung trình bày dạng văn bản) Do việc lọc theo nội dung địi hỏi phân tích phần văn chứa tiêu đề hay nội dung thư, thuật toán lọc nội dung cần xây dựng phù hợp với ngôn ngữ mà thư sử dụng Hiện nay, nhiều thuật toán lọc nội dung hiệu nghiên cứu sử dụng cho thư viết tiếng Anh Trong vịng vài năm gần đây, việc sử dụng Internet nói chung thư điện tử nói riêng ngày phổ biến Việt nam Một hệ phát triển ngày có nhiều thư rác gửi tới tài khoản thư điện tử Việt nam (tài khoản có vn) Những thư rác bao gồm thư viết tiếng Anh thư viết tiếng Việt Việc xuất ngày nhiều thư rác tiếng Việt đặt yêu cầu cấp thiết phải có phương pháp lọc thư xử lý thư rác loại 56 3.2.6 Phân biệt theo ngôn ngữ trước lọc Như nói trên, phân chia thư tiếng Việt tiếng Anh sau tiến hành lọc thư rác riêng cho ngơn ngữ lọc ln không phân biệt thư viết ngôn ngữ Tương tự, phân chia thư tiếng Việt có dấu không dấu trước lọc Để so sánh quy trình phân loại, thử nghiệm tiến hành theo chế độ sau: lọc chung thư tiếng Việt tiếng Anh, lọc riêng thư tiếng Việt thư tiếng Anh, lọc thư tiếng Việt khơng phân thành có dấu-khơng dấu phân chia theo dấu trước lọc Với trường hợp phân chia ngôn ngữ, độ dài đặc trưng chọn k = cho tiếng Việt k = cho tiếng Anh Trường hợp không phân chia ngôn ngữ sử dụng k=1 Số lượng đặc trưng n=2000 Kết so sánh ba quy trình lọc thể bảng 3.2 Kết cho thấy, việc lọc riêng theo ngôn ngữ tiếng Việt cho kết tốt không phân biệt thư tiếng Việt thư tiếng Anh Đây kết việc lựa chọn độ dài đặc trưng phù hợp cho ngôn ngữ Tuy nhiên, mức độ chênh lệch quy trình lọc khơng đáng kể (dưới 1%) thực tế ta bỏ qua giai đoạn phân loại ngôn ngữ 3.2.7 Nhận xét kết thử nghiệm Kết thực nghiệm cho thấy việc tách từ đơn giản cách sử dụng cụm từ liền có độ dài cho kết phân loại thư rác xác cao Đây kết quan trọng cho phép lọc thư tránh trình tách từ phức tạp tốn thời gian sử dụng phương pháp tách từ tiếng Việt phức tạp 57 Hình 3.17: Độ xác phân loại với quy trình lọc khác Số lượng đặc trưng tối ưu lọc thư tiếng Anh tiếng Việt 2000-3000 từ Ngồi việc nâng cao độ xác phân loại, việc khơng phải sử dụng tồn đặc trưng có tập liệu cho phép giảm yêu cầu nhớ u cầu tính tốn Kết thử nghiệm không cho thấy khác biệt đáng kể hiệu lọc thư lọc riêng thư tiếng Việt thư tiếng Anh so với lọc chung Trong số ba phương pháp phân loại sử dụng, phương pháp Bayes đa thức SVM cho kết tốt nhất, nhiên phương pháp Bayes có ưu rõ rệt có độ phức tạp tính tốn thấp nhiều Trong phạm vi nghiên cứu đề cập tới việc phân loại thư tự động dựa phần nội dung văn thư Các hướng nghiên cứu bao gồm việc phân loại thư có nội dung trình bày dạng hình ảnh, nghiên cứu kết hợp nhiều đặc điểm thư format, dòng tiêu đề, địa gửi, thời gian gửi 3.3 Đề xuất giải pháp phòng chống spam 3.3.1 Giải pháp phòng chống mail server Chặn lọc hệ thống máy chủ mail bước quy trình phịng chống thư rác Tất thư điện tử gửi đến người sử dụng phải gửi tới máy chủ mail từ tiếp tục chuyển tới hòm thư người nhận Vì vậy, máy chủ thiết lập sách lọc thư rác tốt hạn chế nhiều thư rác gửi tới người sử dụng Sử dụng phương pháp SPF 58 Sender Policy Framework (SPF) kỹ thuật ngăn chặn spam thuộc nhóm phương pháp xác thực địa người gửi (sender authentication), kỹ thuật giúp người nhận xác thực địa người gửi thật hay giả, từ ngăn chặn việc phát tán thư rác hay lừa đảo trực tuyến Phương pháp SPF tập đoàn American Online (AOL) đưa Phương pháp yêu cầu xác lập DNS, khai báo máy chủ gửi thư từ tên miền Internet định Phía người nhận thơng qua truy vấn DNS để xác thực địa người gửi địa IP có phù hợp với khơng, từ biết địa người gửi thật hay giả Hoạt động SPF mơ tả Hình 1: Hình 3.18: Phương thức hoạt động SPF Trước hết phía gửi thư cần thực thao tác cài đặt máy chủ DNS để khai báo máy chủ email có quyền gửi email sử dụng tên miền phía gửi thư Việc khai báo thực việc sử dụng ghi TXT liệt kê địa IP máy chủ email phép gửi đi: Bước 1: Máy chủ email phía gửi thư thiết lập kết nối tới máy chủ email phía nhận thư qua giao thức SMTP Tại bước thông tin tiêu đề (header) thư gửi từ phía gửi sang phía nhận Thông tin tiêu đề bao gồm tên miền bên gửi địa IP máy chủ email bên gửi; Bước 2: Máy chủ email bên nhận thư tạo truy vấn DNS gửi đến máy chủ DNS bên gửi, yêu cầu cung cấp danh sách máy chủ email phép gửi thư bên gửi; 59 Bước 3:Máy chủ DNS bên gửi trả kết cho máy chủ email bên nhận Sau máy chủ email bên nhận đối chiếu xem địa IP máy chủ email vừa gửi thư có nằm danh sách khơng Nếu có địa người gửi xác nhận hợp lệ Nếu khơng có địa người gửi khơng hợp lệ, thư điện tử có nhiều khả spam Tuy nhiên phương pháp SPF đòi hỏi phải thay đổi sở hạ tầng mạng, cụ thể thay đổi xác lập DNS, tình triển khai thực tế gặp phải khơng khó khăn Lý xuất phát từ chất vấn đề: Bên gửi thư phải cài đặt lại DNS phía mình, người hưởng lợi trực tiếp từ việc cài đặt lại khơng phải bên gửi thư mà bên nhận thư Chính lý đó, thực tế trình triển khai SPF chưa bao Tại Việt Nam phương pháp SPF chưa triển khai Phương pháp SPF động Để khắc phục nhược điểm SPF, ta sử dụng phương pháp SPF động (Dynamic Sender Policy Framework) Ý tưởng phương pháp việc xác thực địa người gửi thực máy chủ DNS đơn vị thứ ba thay thực máy chủ DNS bên gửi thư Như bên nhận thư hưởng lợi ích từ SPF mà bên gửi thư không cần phải xác lập lại máy chủ DNS Hình mơ tả hoạt động SPF động 60 Hình 3.19: Phương thức hoạt động SPF động Cơ sở liệu SPF động chứa thơng tin khai báo máy chủ gửi thư từ tên miền Internet định Cơ sở liệu SPF động xây dựng thông qua thống kê, phân tích số liệu lịch sử Dựa vào sở liệu để phán đoán thư có phải thư rác hay lừa đảo trực tuyến hay không Nếu thư gửi từ địa chi IP có sở liệu ứng với tên miền địa người gửi thư bình thường, ngồi bị nghi vấn thư rác Để hệ thống hoạt động xác sở liệu cần phải xác Các liệu SPF động cung cấp cho người dùng (máy chủ thư điện tử) dạng dịch vụ bên thứ Trong Hình 3., máy chủ nhận thư điện tử, truy vấn dịch vụ máy chủ cung cấp dịch vụ SPF động để lấy thông số địa người gửi, từ xác định địa người gửi thật hay giả Các truy vấn người dùng đến dịch vụ SPF động máy chủ cung cấp dịch vụ ghi lại Số liệu dùng để thống kê, phân tích cập nhật CSDL SPF động Ở sử dụng dịchvụ DNS để cung cấp dịch vụ SPF động, vậy, người dùng cài đặt hay thayđổi thiết lập mà sử dụng dịch vụ SPF động Thách thức lớn phương pháp SPF động làm để tự động cập nhật CSDL SPF động dựa số liệu lịch sử (log) Cập nhật sở liệu SPF động Những thông tin cần chắt lọc từ mẫu bao gồm: Địa IP máy chủ gửi thư; tên miền tương ứng ghi địa thư điện tử người gửi; thời gian gửi thư thông tin phân loại thư: thư rác hay thư bình thường Ba thơng tin đầu dễ dàng lấy từ phần header thư từ log file máy chủ Qua thu thập log file máy chủ mail sở Thông tin Truyền thông tỉnh Nam Địnhvà chắt lọc thơng tin cần thiết Tồn tập mẫu lưu trữ dạng sở liệu, cho phép bước nghiên cứu dễ dàng sử dụng Số lượng thư tập liệu mẫu sau: 61 Bảng 3.4 : Bảng liệu mẫu sử dụng phương pháp SPF động Tổng số thư: 46810 Tổng số thư bình thường: 7855 Tổng số thư rác: 38955 Số thư có nội dung lừa đảo trực tuyến: 53 Thời gian có hiệu lực máy chủ gửi thư Để lọc địa IP thực tên miền máy chủ gửi thư, phải dựa vào thời gian có hiệu lực máy chủ gửi thư Hình mơ tả có khác rõ rệtvề phân bố số lượng cặp (tên miền, IP) thư bình thường thư rác: Thời gian có hiệu lực cặp (tên miền IP) gửi thư rác tập trung vào ngày, giảm dầntheo thời gian, thời gian có hiệu lực cặp (tên miền IP) gửi thư bình thường chủ yếu lớn ngày Hình 3.20: Phân bố số lượng cặp (tên miền, IP) theo thơi gian Kết khẳng định thơng qua thống kê số liệu lịch sử để chắt lọc địa máy chủ thật cho tên miền Tác giả làm thí nghiệm hiệu 62 phương pháp SPF động sử dụng ngưỡng thời gian có hiệu lực khác nhau, kết trình bày Hình Hình 3.21: Hiệu phương pháp SPF động Trong cho thấy sử dụng ngưỡng thời gian có hiệu lực khác ta có sai số khác khả lọc thư rác, ví dụ ngưỡng thời gian có hiệu lực ngày, phương pháp SPF động lọc 98% tổng số thư rác, lọc nhầm 0.1% số thư bình thường 3.3.2 Giải pháp phịng chống mail client Phần mềm Outlook Express dễ bị tin tặc, virus hay spyware công Mặc dù nâng cấp gần cải thiện đáng kể tính bảo mật nguy bị "oanh tạc" cao Để phịng chống thư rác người sử dụng nên thực thao tác: 3.3.2.1.Cập nhật nâng cấp Windows Outlook Express Người dùng nên thường xuyên nâng cấp cho hệ điều hành Windows XP Outlook Express phần khơng thể tách rời XP vá (patch) hay nâng cấp Outlook Express nằm gói update Windows XP Do đó, bạn đặt chế độ nâng cấp Windows tự động phần mềm Outlook Express update lúc 3.3.2.2 Giảm thiểu đọc mail chế độ HTML 63 Đọc tin nhắn dạng text giúp người dùng tránh nguy bị công Mặc dù định dạng HTML hiển thị nội dung e-mail rõ ràng mang lại nhiều rủi ro an ninh cho phần mềm Outlook Express Nếu nhận e-mail từ địa không quen biết, khơng đáng tin cậy việc đọc thư dạng text giải pháp an tồn Để kích hoạt chức này, bạn thực theo hướng dẫn: Trong phần menu Tools, bạn chọn Options chọn Read Read all messages in plain text checkbox Apply Nếu cần đọc e-mail dạng HTML kích hoạt tùy chọn Message in HTML từ menu View Tại hộp thoại tab Read, người dùng nên xóa tích chọn Automatically download message when viewing in the Preview Pane Chức tự động tải email người dùng xem cột Preview load tin nhắn có nội dung độc hại Do đó, bạn nên tắt tính 3.3.2.3 Hạn chế tải hình ảnh Outlook Express E-mail dạng HTML trơng đẹp mắt với hình ảnh kèm “bóng bẩy” lại ẩn chứa nhiều virus, spyware mà người dùng Tin tặc lợi dụng điều để phát tán virus qua file ảnh Do đó, để “kìm hãm” hội cơng tin tặc thực theo hướng dẫn sau: Trong hộp thoại Options chọn tab Security chọn vào mục Block images and other external content in HTML e-mail OK để đóng hộp thoại Ngồi việc tăng bảo mật, cài đặt giúp người dùng đọc download email nhanh “đèo bịng” thêm hình ảnh 3.3.2.4 Chặn file đính kèm khơng an tồn File đính kèm e-mail thuận tiện người dùng cần gửi tài liệu cho người khác Tuy nhiên, gửi cho bạn file thực thi (EXE) biết có chứa virus hay khơng Để tránh file đính kèm khơng an tồn bạn nên tùy chỉnh lại cài đặt Outlook Express 64 Trong hộp thoại Options chọn tab Security cịn vào Do not allow attachments to be saved or opened that could potentially be a virus Apply Lúc này, Outlook cho phép người dùng mở e-mail cịn file đính kèm khơng hiển thị Để tắt cài đặt này, bạn hủy nút chọn mục Do not allow attachments to be saved or opened that could potentially be a virus 3.3.2.5 Sử dụng Internet Security Zones Cả Outlook Express Internet Explorer có thiết lập Internet giống hệ điều hành Windows XP Người dùng nên sử dụng vùng “nghiêm cấm” Restricted sites thay Internet zone để chặn tính khơng an tồn website mở Bạn tùy chỉnh vùng an toàn hộp thoại Options Internet Explorer Tại tab Security chọn biểu tượng Restricted sites Người dùng thêm website vào vùng “hạn chế” mục Custom Level để dễ kiểm soát 3.3.2.6 Chặn spam Mặc dù Outlook Express khơng có lọc thư rác Junk E-Mail Outlook chặn spam theo cách sau - Chặn e-mail có chứa từ ngữ tục tĩu Tại menu Tools - Messsage Rules - Mail Sẽ xuất bảng “nguyên tắc”New Mail Rule Tại phần số (Select the conditions for your rule), chọn ô Where the Subject line contains specific words Where the message body contains specific words nhấn vào phần dấu gạch chân tương ứng phần số để điền vào từ ngữ xấu xuất thư rác Tại phần số (Select the Actions for your rule), bạn chọn ô Move it to the specific folder hay Delete it Các lựa chọn xuất ô số Khi thực xong, nhấn OK để lưu quy tắc - Chặn địa hay xuất hịm thư Cũngtrong mục Message Rules, tạo danh sách chặn địa thường gửi thư quấy rối cách chọn vào Blocked Senders Tiếp đó, nhập địa e-mail hay tên miền muốn ngăn chặn 65 3.3.3 Giải pháp phía người sử dụng mail Ngoài việc sử dụng lọc chống spam, người sử dụng đóng vai trị quan trọng việc chống lại “đại dịch” thư rác Bởi người dùng cần tuân theo số nguyên tắc sau: − Luôn cập nhật vá phần mềm cài đặt máy − Đảm bảo tất máy cập nhật phần mềm chống virus chống spam − Sử dụng firewall để bảo vệ hệ thống − Không trả lời email lạ không rõ nguồn gốc Đối với spammer, nhận trả lời từ hàng ngàn email họ gửi chứng minh phương pháp có hiệu Ngồi ra, việc trả lời lại xác nhận địa email bạn có thực sử dụng Do địa email bạn “đáng giá” hơn, spammer gửi nhiều thư rác − Không gửi thông tin cá nhân bạn (số thẻ tín dụng, mật khẩu, tài khoản ngân hàng, v.v ) thư điện tử Các spammer kẻ lừa đảo qua mạng tạo trang web giả mạo tổ chức, ngân hàng đề nghị bạn gửi mật số thông tin thẻ tín dụng bạn qua email − Không hồi đáp email cách nhấn lên từ “loại bỏ” (remove) “ngừng đăng ký” (unsubscribe) dòng tiêu đề nội dung thư trừ nguồn đáng tin cậy (các email tiếp thị trực tiếp) Đây tiểu xảo spammer để người sử dụng hồi đáp lại spam họ Khi nhận hồi đáp, spammer không loại bỏ địa email bạn khỏi danh sách mà cịn gửi tới nhiều spam họ biết địa email bạn hoạt động 66 − Không bấm vào liên kết URL địa trang web ghi spam hướng dẫn người nhận ngừng đăng ký Điều cho người gửi biết địa email bạn sử dụng bạn nhận nhiều spam − Hãy sử dụng hai địa email khác nhau, địa sử dụng cho việc riêng bạn bè, công việc Một địa sử dụng để đăng ký trở thành thành viên diễn đàn, tổ chức nơi mà địa email bạn bị lạm dụng bán − Không nên đăng địa email bạn nơi cơng cộng (ví dụ diễn đàn, bảng tin, chat room ) nơi spammer thường sử dụng tiện ích để thu thập tìm kiếm địa email − Sử dụng dịch vụ email cung cấp cơng cụ chống spam, ví dụ Yahoo! Mail, Gmail − Không chuyển tiếp spam cho người khác − Chuyển spam nhận đến người quản trị hệ thống email Quản trị viên thay đổi chương trình lọc để lần sau hệ thống chặn lại email tương tự Có nhiều phương pháp kỹ thuật để lọc chặn thư rác áp dụng Mỗi phương pháp có ưu điểm nhược điểm riêng hiệu lọc thư rác khác Để việc chặn thư rác hiệu cần phải có phối hợp đồng nhiều đơn vị, tổ chức thân người sử dụng email 67 KẾT LUẬN CHUNG Với phân tích trên, thấy thư rác ngày phát triển gây thiệt hại lớn kinh tế gây nhiều phiền toái cho người dùng Số lượng thư rác ngày tăng, nội dung cấu trúc chúng thay đổi cần có hệ thống học máy lọc thư để cập nhật, loại bỏ mẫu thư Hệ thống học máy lọc thư rác dựa nội dung sử dụng phương pháp phân loại Bayes đơn giản xây dựng đáp ứng điều Luận văn đạt số kết sau: - Khái quát số nội dung thư rác, phương pháp lọc thư rác - Trình bày chi tiết phương pháp lọc thư rác theo nội dung theo phương pháp Bayes đơn giản - Đã tiến hành xây dựng chương trình lọc thư rác đơn giản áp dụng phương pháp Bayes đơn giản, cho chạy thực nghiệm phân tích sơ kết - Trong trình xây dựng lọc thư, sử dụng kết hợp việc lọc theo nội dung với phương pháp lọc khác sử dụng danh sánh IP cấm, kết hợp lọc theo nội dung với lọc theo tiêu đề thành phần khác thư Trong trình nghiên cứu thực luận văn này, nhận giúp đỡ nhiệt tình thầy hướng dẫn - Tiến sĩ Nguyễn Ngọc Cương - Học viện An ninh thầy, cô Học viện An ninh Trường ĐH Công nghệ thông tin Truyền thông - Đại học Thái Nguyên tạo điều kiện hướng dẫn thực luận văn này, lần xin gửi lời cảm ơn tới thầy cô kính chúc thầy sức khỏe, nhiều thành công công việc 68 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Vũ Đình Cường, Từng bước khám phá an ninh mạng Thư rác phương pháp phát tán cách phòng chống, Nhà xuất Lao động Xã hội năm 2009; [2] Phạm Tuấn Liêm, Virus & Spam - Những điều cần biết; [3] Phùng Chí Tuệ Bảo mật Email cách phòng chống spam 2009; [4] Các tài liệu bảo mật Email cách phòng chống spam mạng Internet [5] Virus Email phương thức hoạt động cách phòng chống, Nhà xuất Từ điển Bách Khoa, Minh Tâm biên soạn [6] help.outlook.com/vi-vn [7] www.hoangvi.com [8] www.vinaren.vn [9] www.pcworld.com.vn Tiếng Anh [10] Chakrabarti, S (2003), Mining the Web; Discovering Knowiedge from Hypertext Data, Morgan Kaufmann, 2003 [11] Chen, C, Lee, H & Hwang, C (2005) A Hierarchical Neural Network Document Classifier with Linguistic Featura Selection, Applied Intelligence, 23, pp 277-294 [12] R Du, W Surilo, F Safaei and P Boustead (2003); Protecting an MPLS based Programmable Virtural Network using Distributed Fire wall, Technicel Report, University of Wollongong, http://atnac2003.atcre.com/POSTERS/Du.pdf [13] Terry Kuny, Filtering Internet Contents: PICS, Labels and Filters, March 23, 1998 69 [14] Jeff Heaton, Programming Spiders Bots and Aggretaors in Java, NXB Sybex, 2002 [15] Cancedda, N., Gaussier, E., Goutte, C & Renders, J.M Word sequence kernels Journal of Machine Learning Research, 3, pp 1059-1082, 2003 [16] Greenfield P, Rickwood P and Tran HC, Effectiveness of Internet Filtering Software Products, CSIRO, September 2001 i ... cho ứng dụng thư điện tử Sở Thông tin Truyền thông tỉnh Nam Định Đề xuất giải pháp phòng chống spam Phần kết luận chung nêu tóm tắt kết đạt luận văn 3 Chương 1: TỔNG QUAN VỀ THƯ ĐIỆN TỬ VÀ SPAM. .. GIẢI PHÁP PHỊNG CHỐNG SPAM Trình bày nội dung cài đặt thử nghiệm, công nghệ áp dụng kết chương trình lọc spam cho ứng dụng thư điện tử Sở Thông tin Truyền thông tỉnh Nam Định Đề xuất giải pháp. .. điện tử Sở Thông tin Truyền thông tỉnh Nam Định 44 3.2.1 Khảo sát việc sử dụng mail Sở Thông tin Truyền thông tỉnh Nam Định 44 3.2.2 Dữ liệu thử nghiệm 45 3.2.3 Phương

Ngày đăng: 09/12/2016, 18:12

Từ khóa liên quan

Mục lục

  • LỜI CAM ĐOAN

  • LỜI CẢM ƠN

  • DANH MỤC CÁC HÌNH

  • DANH MỤC CÁC BẢNG

  • DANH MỤC TỪ VIẾT TẮT

  • MỞ ĐẦU

  • Chương 1: TỔNG QUAN VỀ THƯ ĐIỆN TỬ VÀ SPAM

    • 1.1 Các khái niệm cơ bản

      • 1.1.1. Thư điện tử là gì?

      • 1.1.2. Cấu trúc chung của một địa chỉ thư điện tử

      • 1.1.3. Sự khác biệt giữa thư điện tử với thư bưu chính

      • 1.1.4. Thư rác là gì?

      • 1.1.5. Các loại thư rác

      • 1.1.6. Tác hại của thư rác

      • 1.2. Phương thức trao đổi thông tin qua dịch vụ Email

        • 1.2.1. Mô hình trao đổi thông tin dựa trên email

        • 1.2.2. Giao thức và ngôn ngữ sử dụng

        • 1.3. Các phần mềm lọc nội dung mail ở trong và ngoài nước.

        • Chương 2: CÁC PHƯƠNG PHÁP GỬI VÀ KỸ THUẬT LỌC EMAIL - SPAM

          • 2.1. Các kỹ thuật gửi mail nặc danh và Bomb Mail

            • 2.1.1. Thu thập địa chỉ email

            • 2.1.2. Tìm kiếm các máy tính trên Internet cho phép gửi thư

            • 2.1.3. Boml Mail

            • 2.2. Mô hình và nguyên lý hoạt động của hệ thống lọc nội dung Mail

              • 2.2.1. Mô hình hệ thống lọc mail

              • 2.2.2. Kiến trúc tổng quan của hệ thống lọc mail

Tài liệu cùng người dùng

Tài liệu liên quan