nghiên cứu giải pháp lọc nội dung internet tại máy tính cá nhân và xây dựng phần mềm

71 443 0
nghiên cứu giải pháp lọc nội dung internet tại máy tính cá nhân và xây dựng phần mềm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Tiến Dũng NGHIÊN CỨU GIẢI PHÁP LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH NHÂNXÂY DỰNG PHẦN MỀM LUẬN VĂN THẠC SĨ Hà Nội – 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Tiến Dũng NGHIÊN CỨU GIẢI PHÁP LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH NHÂNXÂY DỰNG PHẦN MỀM Ngành : Công nghệ Thông tin Chuyên ngành : Hệ thống Thông tin Mã số : 60 48 05 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. HÀ QUANG THỤY Hà Nội - 2009 LỜI CAM ĐOAN Tôi xin cam đoan nội dung bản luận văn chưa từng được công bố hay xuất bản dưới bất kỳ hình thức nào cũng không được sao chép từ bất kỳ một công trình nghiên cứu nào. Toàn bộ ứng dụng thử nghiệm đều do tôi tự thiết kế xây dựng. Nếu sai tôi xin hoàn toàn chịu trách nhiệm. Hà Nội, tháng 08 năm 2009 Người cam đoan Phạm Tiến Dũng LỜI CẢM ƠN Em xin chân thành cảm ơn các Thầy giáo, Cô giáo trong khoa Công nghệ thông tin các cán bộ, nhân viên phòng Đào tạo Sau đại học, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội đã luôn nhiệt tình giúp đỡ tạo điều kiện tốt nhất cho em trong quá trình học tập tại trường. Xin chân thành cảm ơn các anh, chị các bạn học viên lớp Cao học K12T3 - trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với em những kinh nghiệm học tập, công tác trong suốt khoá học. Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS. Hà Quang Thụy đã tận tình giúp đỡ em định hướng xây dựng, nghiên cứu phát triển hoàn chỉnh luận văn. Mặc dù đã có nhiều cố gắng, song bài luận văn không tránh khỏi những khiếm khuyết do sự hạn hẹp về thời gian điều kiện nghiên cứu. Em chân thành mong nhận được những ý kiến đóng góp quý báu của các thầy cô giáo nhằm giúp đề tài của luận văn ngày một hoàn thiện tính phổ dụng trong tương lai. MỤC LỤC MỤC LỤC i DANH SÁCH HÌNH VẼ ii MỞ ĐẦU iii Chương 1 - TỔNG QUAN LỌC NỘI DUNG INTERNET 1 1.1. Đánh giá tình hình nghiên cứu thuộc lĩnh vực đề tài 1 1.1.1. Thế giới 1 1.1.2. Tại Việt Nam 3 1.2. Thực trạng lọc nội dung truy cập hiện nay 4 Chương 2 - MỘT SỐ NỘI DUNG CƠ BẢN VỀ PHƯƠNG PHÁP LỌC INTERNET 7 2.1. Biện pháp lọc 7 2.2. Phương pháp lọc 8 2.2.1. Lọc địa chỉ IP 8 2.2.2. Lọc địa chỉ URL 9 2.2.3. Lọc từ khóa 9 2.2.4. Lọc cụm từ 10 2.2.5. Lọc ảnh 10 2.3. Vị trí thực hiện lọc 11 2.3.1. Lọc tại cổng Internet quốc gia 11 2.3.2. Lọc tại cổng Internet mạng LAN 11 2.3.3. Lọc thông qua bên thứ ba 12 2.3.4. Lọc tại máy tính nhân 12 Chương 3 - GIẢI PHÁP LỌC NỘI DUNG INTERNET 13 3.1. Giải pháp tại cổng Internet quốc gia 13 3.1.1. Kiến trúc hệ thống 13 3.1.2. Hoạt động 15 3.1.3. Phân tích các thành phần 16 3.2. Giải pháp tại cổng Internet của mạng LAN 19 3.2.1. Kiến trúc tổng quan 19 3.2.2. Giải thuật cơ chế hoạt động 19 3.3. Giải pháp trực tiếp trên máy tính nhân 24 3.3.1. User mode: lấy nội dung từ lớp ứng dụng (Application) 25 3.3.2. User Mode: lấy nội dung từ lớp phiên (Session) 29 3.3.3. Kernel mode: lấy nội dung từ lớp mạng (IP) 32 3.3.4. Kernel mode: cơ chế nghe lén (sniffer) 35 3.4. Đề xuất giải pháp 36 3.4.1. Đánh giá giải pháp trực tiếp 36 3.4.2. Đề xuất 37 Chương 4 - GIẢI PHÁP LỌC NỘI DUNG XÂY DỰNG PHẦN MỀM TẠI MÁY TÍNH NHÂN 39 4.1. Giải thuật 39 4.2. Hoạt động 40 4.3. Phân tích các thành phần 41 4.3.1. Thành phần lấy dữ liệu 41 4.3.2. Thành phần phân tích nội dung gói tin 45 4.3.3. Thành phần tách, tổng hợp gói tin thành phiên giao dịch 48 4.3.4. Thành phần lọc cụ thể, lọc loại trừ 51 4.3.5. Thành phần lọc nội dung 52 4.3.6. Thành phần quản lý ứng dụng 54 4.3.7. Thành phần ghi log truy cập 56 4.3.8. Thành phần quản lý luật truy cập 56 4.4. Chương trình thử nghiệm 57 4.4.1. Kết quả chương trình thử nghiệm 57 4.4.2. So sánh với chương trình cùng loại 58 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 61 DANH SÁCH HÌNH VẼ Hình 2.1. Lọc tại cổng Internet quốc gia 11 Hình 2.2. Lọc thông qua bên thứ ba 12 Hình 2.3. Lọc tại máy tính nhân 12 Hình 3.1. Hệ thống tưởng lửa hiện tại của các ISP 14 Hình 3.2. Kiến trúc hệ thống lọc nội dung Internet tại ISP 15 Hình 3.3. Gateway Filter lọc cho một mạng LAN 19 Hình 3.4. Sơ đồ giải thuật lọc cho mạng LAN 1 20 Hình 3.5. Sơ đồ giải thuật lọc cho mạng LAN 2 22 Hình 3.6. Sơ đồ giải thuật lọc cho mạng LAN 3 23 Hình 3.7. Sơ đồ giải thuật lọc cho mạng LAN 4 24 Hình 3.8. Nội dung kiểm soát lấy từ cửa sổ trình duyệt 26 Hình 3.9. Sơ đồ giải thuật User mode (lấy nội dung lớp ứng dụng) 27 Hình 3.10. Hook Firewall ở User Mode 30 Hình 3.11. Sơ đồ giải thuật User mode (lấy nội dung lớp phiên) 31 Hình 3.12. Các chế độ Hook Firewall trên Windows 33 Hình 3.13. Sơ đồ giải thuật Kernel mode (lấy nội dung lớp IP) 34 Hình 4.1. Sơ đồ giải thuật lọc nội dung trực tiếp trên máy tính nhân 39 Hình 4.2. Phân lớp xử lý gói tin 41 Hình 4.3. Sơ đồ xử lý tổng quát giải pháp lọc nội dung 42 Hình 4.4. Quy trình ghi log truy cập 42 Hình 4.5. Cấu trúc dữ liệu tầng Transport 43 Hình 4.6. Cấu trúc dữ liệu tầng Network 44 Hình 4.7. Cấu trúc dữ liệu tầng DataLink 44 Hình 4.8. Cấu trúc gói tin lấy dữ liệu 45 Hình 4.9. Các gói tin dạng thô được phân tích theo từng lớp mạng 47 Hình 4.10. Dữ liệu tầng TCP/IP của một gói tin 48 Hình 4.11. Header file ảnh 48 Hình 4.12. Header file text/html 49 Hình 4.13. Gói tin đầu tiên của một phiên giao dịch 49 Hình 4.14. Tham số Seq Ack 49 Hình 4.15. Tham số Seq Ack gói tin kế tiếp 50 Hình 4.16. Tổng hợp các gói tin đơn lẻ thành phiên giao dịch 50 Hình 4.17. Trích đoạn danh sách lọc đang được áp dụng cho mạng VNN 51 Hình 4.18. Gói tin request(Get) 52 Hình 4.19. Ánh xạ tên tiến trình cổng tương ứng 55 Hình 4.20. Ánh xạ chi tiết PID (Process number) số cổng 55 Hình 4.21. Tổng hợp ghi log 56 Hình 4.22. Cập nhật luật truy cập từ server 57 MỞ ĐẦU Mạng Internet ra đời phát triển thành một kho dữ liệu khổng lồ, bao gồm đầy đủ các khía cạnh về văn hoá, chính trị, khoa học - kỹ thuật, Với sự đa sắc màu văn hoá trên thế giới, đa tín ngưỡng, đa lối sống, đa tư duy,… đã làm cho thông tin trên Internet luôn song hành tính tích cực tiêu cực trong nội tại. Ưu thế từ công nghệ Internet làm cho sức thâm nhập của kênh thông tin quan trọng này đối với người sử dụng rất rộng lớn nhanh chóng. Các khía cạnh xấu - độc hại trong xã hội cũng theo đường Internet để thâm nhập vào mỗi gia đình, mỗi con người. Chính vì lý do đó, công việc hỗ trợ quản lý đảm bảo an toàn – an ninh thông tin trên mạng Internet đã trở thành mối quan tâm của mỗi gia đình, mỗi tổ chức, mỗi quốc gia. Về phương diện gia đình, mối quan tâm của các bậc phụ huynh là ngăn ngừa việc thâm nhập các trang Web độc hại đối với con em mình. Về phía nhân người sử dụng, khai thác được những thông tin tích cực ngăn ngừa tiếp xúc web độc hại do vô tình hay cố ý. Trong những năm gần đây, lĩnh vực nghiên cứu phát triển hệ thống lọc nội dung hỗ trợ quản lý đảm bảo an toàn – an ninh thông tin trên mạng Internet nhận được sự quan tâm đặc biệt ở hầu hết các quốc gia trên thế giới. Tại Việt Nam, giải pháp cấp quốc gia đã được Nhà nước chỉ đạo các ban ngành liên quan nghiên cứu đề xuất. Tuy nhiên trước thực tế nhu cầu cần giải pháp lọc nội dung truy cập của người sử dụng Internet, tìm hiểu xây dựng giải pháp lọc nội dung truy cập trực tiếp trên máy tính nhân hiện đang là mục tiêu nghiên cứu của nhiều nhân, tập thể đây chính là mục tiêu của luận văn này. Chương thứ nhất của luận văn trình bày tổng quan về lọc nội dung Internet trên thế giới tại Việt Nam, phân tích thực trạng về lọc nội dung truy cập hiện nay trên phương diện về chính sách quy định của Nhà nước cũng như yêu cầu đặt ra đối với các công cụ phần mềm. Chương thứ hai của luận văn trình bày các nội dung cơ bản liên quan đến vấn đề lọc nội dung truy cập Internet, bao gồm: biện pháp lọc, phương pháp lọc vị trí thực hiện lọc. Dựa trên việc phân tích về vị trí thực hiện lọc nội dung đã trình bày trong chương hai, chương thứ ba trình bày về các giải pháp lọc nội dung truy cập tại cổng Internet Quốc gia, tại cổng Internet của mạng LAN giải pháp trực tiếp trên máy tính nhân. Cuối cùng, chương thứ tư trình bày về giải pháp xây dựng chương trình lọc nội dung truy cập Internet tại máy tính nhân. Trong các trường hợp thử nghiệm, chương trình đã hoạt động đúng chức năng đặt ra. [...]... 2.3.4 Lọc tại máy tính nhân Đa số các giải pháp lọc hiện nay được thiết kế để chạy trên các máy tính nhân Kỹ thuật lọc thực hiện kết hợp các phương pháp lọc phổ biến trên (mục 1.2) Bộ luật lọc mới nhất được cập nhật định kỳ từ các nhà cung cấp phần mềm Lọc tại máy tính nhân ưu điểm về nguồn lực dư thừa máy tính, thời gian xử lý thực, tiết kiệm chi phí đầu tư phần cứng Tuy nhiên, lọc tại máy tính. .. tại máy tính nhângiải pháp ít tin cậy nhất do phần mềm hoạt động trong môi trường không bảo mật, dễ bị vô hiệu hóa Hình 2.3 Lọc tại máy tính nhân 12 Chương 3 - GIẢI PHÁP LỌC NỘI DUNG INTERNET Trong chương hai đã trình bày về một số nội dung cơ bản của phương pháp lọc nội dung Internet: biện pháp lọc, phương pháp lọc và vị trí thực hiện lọc Với mỗi nội dung đã trình bày đặc trưng phân tích... hết phải hiểu rõ bản chất của nội dung Internet Vì vậy, chương này sẽ tập trung nghiên cứu những nội dung liên quan đến hình thái lọc như biện pháp lọc, phương pháp lọc và vị trí thực hiện Từ đó có thể xây dựng được chương trình lọc nội dung truy cập Internet 2.1 Biện pháp lọc Căn cứ vào các yêu cầu đặt ra đối với lọc nội dung truy cập Internet, có thể chia biện pháp lọc thành một số loại cụ thể như... phân tích về kỹ thuật Đó là cơ sở cho phần tiếp sau, phần trình bày về các giải pháp lọc nội dung Internet tại ba cấp độ khác nhau: cổng Internet quốc gia, cổng Internet cho mạng LAN tại máy tính nhân 3.1 Giải pháp tại cổng Internet quốc gia 3.1.1 Kiến trúc hệ thống Hệ thống tường lửa tại các ISP hiện tại Hiện nay các nhà cung cấp dịch vụ Internet tại Việt Nam đều đang sử dụng hệ thống tường... vào cache o Forward header từ Proxy tới client o Kiểm tra xem phần body đã được tải xuống lưu trữ hay chưa Nếu rồi thì gửi cho client phần nội dung bypass Nếu chưa thì forward body từ proxy tới client 3.3 Giải pháp trực tiếp trên máy tính nhân Giải pháp tường lửa lọc nội dung trên máy tính nhângiải pháp triển khai trực tiếp trên từng máy tính, nó thực hiện kiểm soát nội dung truy cập Internet. .. Thành phần Lọc cụ thể, lọc loại trừ o Thành phần Lọc nội dung Về cơ bản tường lửa lọc nội dung nhân được xây dựng gồm các thành phần như trên nhưng do áp dụng biện pháp khác nhau tại thành phần Lấy nội dung nên có thể chia ra thành những loại sau: 3.3.1 User mode: lấy nội dung từ lớp ứng dụng (Application) Việc kiểm soát nội dung truy cập Internet của người sử dụng sẽ được thực hiện trực tiếp trên các... cập Internet vào/ra trên máy tính đó Có thể nói đây là giải pháptính ‘phân tán’ cao nhất, vì hoạt động quản lý trực tiếp trên một máy tính thay vì cổng Internet mạng LAN, cổng Internet quốc gia Phần mềm lọc nội dung truy cập Internet sẽ được cài đặt trực tiếp trên hệ điều hành của người dùng Thành phần của tường lửa lọc nội dung nhân bao gồm: 24 o Thành phần Lấy nội dung o Thành phần Bộ quyết... TỔNG QUAN LỌC NỘI DUNG INTERNET 1.1 Đánh giá tình hình nghiên cứu thuộc lĩnh vực đề tài 1.1.1 Thế giới Hầu hết các nước trên thế giới đều xây dựng thực hiện các chính sách quốc gia về an toàn – an ninh Internet, trong đó đặc biệt chú ý tới vấn đề lọc nội dung trên Internet Ngoài một số công bố về vấn đề lọc nội dung đối với nước Mỹ [ 1 ], một số công trình nghiên cứu về lọc nội dung trên Internet. .. máy tính nhân, trên một máy chủ của doanh nghiệp, tại một công ty cung cấp dịch vụ internet, hoặc trên một hệ thống lọc của bên thứ ba 2.3.1 Lọc tại cổng Internet quốc gia Các giải pháp lọc cũng được thiết kế để hoạt động tại ISP nhưng do đặc tính về đảm bảo hoạt động tại ISP nên hiện nay các giải pháp lọc hiện chỉ thực hiện hạn chế đối với danh sách địa chỉ IP đen Hình 2.1 Lọc tại cổng Internet. .. có nội dung hoàn chỉnh cung cấp đầu vào cho thành phần lọc nội dung o Tăng tốc độ trong việc phân tích các trang web khác trên cùng một site: do không phải lấy lại những file đã có o Giảm thiểu thời gian bị trì hoãn khi duyệt web của người dùng do hệ thống lọc nội dung gây ra Lọc nội dung: Thành phần Lọc nội dung là thành phần chính của tường lửa lọc nội dung Một tường lửa thông thường sẽ thực hiện lọc . HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Tiến Dũng NGHIÊN CỨU GIẢI PHÁP LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH CÁ NHÂN VÀ XÂY DỰNG PHẦN MỀM. Chương 4 - GIẢI PHÁP LỌC NỘI DUNG VÀ XÂY DỰNG PHẦN MỀM TẠI MÁY TÍNH CÁ NHÂN 39 4.1. Giải thuật 39 4.2. Hoạt động 40 4.3. Phân tích các thành phần 41 4.3.1.

Ngày đăng: 17/02/2014, 20:41

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan