Nghiên cứu một số phương pháp phát hiện thay đổi nội dung trang web

58 290 1
Nghiên cứu một số phương pháp phát hiện thay đổi nội dung trang web

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐẶNG HÙNG THẮNG NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI NỘI DUNG TRANG WEB BÁO CÁO LUẬN VĂN THẠC SỸ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH THÁI NGUYÊN, NĂM 2015 ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc đến Thầy TS Vũ Duy Linh người giúp đỡ suốt thời gian thực đề tài Thầy định hướng, tạo điều kiện thuận lợi tận tình hướng dẫn để tơi hồn thành đề tài Tôi xin gửi lời cảm ơn chân thành đến gia đình, bạn bè ln nguồn động viên to lớn, giúp đỡ suốt trình tơi thực đề tài TÁC GIẢ LUẬN VĂN Đặng Hùng Thắng iii LỜI CAM ĐOAN Những kết nghiên cứu trình bày luận văn hồn tồn trung thực tơi, khơng vi phạm điều luật sở hữu trí tuệ pháp luật Việt Nam Nếu sai, tơi xin chịu hồn tồn trách nhiệm trước pháp luật TÁC GIẢ LUẬN VĂN Đặng Hùng Thắng iv MỤC LỤC LỜI CAM ĐOAN i DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT vi DANH MỤC HÌNH VẼ viii PHẦN MỞ ĐẦU: GIỚI THIỆU BÀI TOÁN THEO DÕI SỰ THAY ĐỔI NỘI DUNG TRANG WEB Chương TỔNG QUAN VỀ AN TOÀN NỘI DUNG SỐ VÀ WEBSITE 1.1 Vấn đề đảm bảo tính an tồn nội dung internet 1.2 Những nguy tiềm ẩn việc bảo mật nội dung số internet 1.3 Giải pháp đảm bảo tính tồn vẹn văn điện tử 1.3.1 Khái niệm chữ ký số 1.3.2 Tính lợi điểm chữ ký sô 1.3.3 Cách thức hoạt động chữ ký số 1.4 Việc đảm bảo an toàn nội dung Website Internet 1.4.1 Mục đích cơng trang Web 1.4.2 Các kiểu cơng thường gặp cách phịng chống 1.5 Vai trị mục đích việc theo dõi thay đổi nội dung trang web 16 1.6 Kết luận chương 17 Chương NHỮNG PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI NỘI DUNG 18 2.1 Những đề Web 18 2.1.1 Khái niệm 18 2.1.2 Một số mơ hình kiến trúc web 23 2.1.3 Mô tả Website cách hoạt động 27 2.1.4 Các dịch vụ ứng dụng web 28 2.2 Một số phương pháp đảm bảo an ninh Web 29 2.2.1 Đảm bảo an ninh hệ điều hành Webserver 29 2.2.2 Bảo đảm an ninh nội dung Web 30 2.2.3 Sử dụng kỹ thuật xác thực mã hóa 31 2.2.4 Triển khai sở hạ tầng mạng an ninh 33 v 2.2.5 Quản trị Webserver 34 2.3 Sử dụng dấu vân tài liệu (Document Fingerprint) việc theo dõi thay đổi nội dung trang Web 35 2.4 Thuật toán kiểm tra dấu vân tay tài liệu - Rabin Fingerprint 36 2.5 Kết luận chương 37 Chương XÂY DỰNG HỆ THỐNG PHÁT HIỆN THAY ĐỔI NỘI DUNG TRANG WEB 38 3.1 Đề xuất cải tiến giải thuật Rabin Fingerprint 38 3.2 Hệ thống phát thay đổi nội dung trang Web 39 3.2.1 Hệ thống Builder 41 3.2.2 Hoạt động Multi-checker 41 3.2.3 Hệ thống Self-watcher 43 3.2.4 Hệ thống Admin 44 3.3 Cài đặt thử nghiệm chương trình 44 3.3.1 Cài đặt chương trình 44 3.3.2 Thử nghiệm chương trình 46 3.3.3 Nhận xét kết 48 3.4 Kết luận chương 48 KẾT LUẬN VÀ KHUYẾN NGHỊ 49 Kết luận 49 Khuyến nghị 49 TÀI LIỆU THAM KHẢO 50 vi DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT STT Kí hiệu 01 CERT 02 PKI 03 CA 04 SQL Tiếng việt Tiếng anh Computer Emegancy Response Team Thuật tốn mã hóa cơng khai Nhà cung cấp dịch vụ chứng thực chữ ký số Certification Aithority Ngơn ngữ truy vấn Structured Query mang tính cấu trúc Language Là kiểu công 05 XSS cho phép kẻ công chèn đoạn script Cross Site Scripting độc hại vào website 06 DOS Từ chối dịch vụ Dinal of Services 07 VPN Mạng riêng ảo Virtual Private Network 08 Firewall Tường lửa 09 HTML Ngôn ngữ đánh dấu Hypertext Markup siêu văn Language Kết hợp giao thức 10 HTTPS HTTP giao thức bảo mật SSL hay TLS 11 SSL Giao thức bảo mật Secure Sockets Layer 12 TLS Giao thức bảo mật Transport Layer Security 13 OSI Mơ hình hệ thống mở Open Systems Interconnection vii Định vị tài nguyên Uniform Resource thống Locator Ngôn ngữ đánh dấu Xtensible Markup mở rộng Language IP Địa IP Internet protocol 17 DNS Hệ thống tên miền Domain name System 18 CSDL Cơ sở liệu 14 URL 15 XML 16 viii DANH MỤC HÌNH VẼ Hình 1.1 Mơ tả hoạt động gửi văn ký số Hình 1.2 Mơ tả hoạt động giải mã xác minh văn điện tử Hình 1.3 Mơ hình cơng SQL Injection 10 Hình 1.4 Một mơ hình cơng từ chối dịch vụ DOS 14 Hình 2.1 Một số Web Server thông dụng 22 Hình 2.2 Mơ hình kiến trúc web lớp 23 Hình 2.3 Mơ hình kiến trúc web lớp 24 Hình 2.4 Mơ hình kiến trúc web lớp 25 Hình 2.5 Mơ hình kiến trúc web N lớp 26 Hình 2.6 Minh hoạ giải thuật Rabin Fingerprint 37 Hình 3.1 Minh hoạ cải tiến giải thuật Rabin Fingerprint 39 Hình 3.2 Sơ đồ kiến trúc hệ thống giám sát website 41 Hình 3.3 Các thuộc tính tập tin 42 Hình 3.4 Giao diện hệ thông theo dõi thay đổi nội dung trang web .45 Hình 3.5 Chương trình theo dõi website đồng thời 47 Hình 3.6 Hoạt động chức Advanced Mode 47 PHẦN MỞ ĐẦU: GIỚI THIỆU BÀI TOÁN THEO DÕI SỰ THAY ĐỔI NỘI DUNG TRANG WEB Đặt vấn đề Cùng với phát triển công nghệ thông tin, cơng nghệ máy tính mạng Internet ngày dịch vụ mạng có mặt hầu hết lĩnh vực đời sống xã hội Các thông tin Internet đa dạng phong phú, có nhiều thơng tin địi hỏi u cầu cao bảo mật tính kinh tế, xác tin cậy thơng tin Bên cạnh hình thức phá hoại Internet ngày trở nên tinh vi phức tạp nhiệm vụ đặt cho người quản trị mạng quan trọng cần thiết Với phát triển nhanh Web ứng dụng Web nay, việc bảo mật an ninh thông tin cho trang Web quan trọng nhà quản trị hay nhà phát triển tâm tới việc bảo mật an ninh cho sản phẩm mình, nhiều Website tồn lỗ hổng bảo mật an ninh cao gây nguy bị công, thiệt hại nhiều bị công Việc phát nguy thủ công khó, việc người quản trị hay người phát triển muốn kiểm tra mức độ an toàn sản phẩm gặp phải nhiều khó khăn Đề tài nghiên cứu nghiên cứu xây dựng hệ thống với công cụ phát thay đổi nội dung trang Web đưa cảnh bảo cho người quản trị để có biện pháp xử lý kịp thời Chương TỔNG QUAN VỀ AN TOÀN NỘI DUNG SỐ VÀ WEBSITE 1.1 Vấn đề đảm bảo tính an tồn nội dung internet Ngày nay, với phát triển mạnh mẽ công nghệ thông tin đời hàng loạt dịch vụ internet điều mang lại cho cá nhân, tổ chức, đơn vị, doanh nghiệp nhiều tiện ích, thuận lợi Mọi người sử dụng internet công cụ bắt buộc hoạt động cá nhân Các đơn vị, tổ chức, doanh nghiệp sử dụng internet hoạt động đơn vị Những internet mạng lại lớn, phần thiếu sống địa ngày Ở đâu, máy tính có nối mạng Internet, người thực chia sẻ, đăng tải thơng tin, mua bán, tốn cách thuận tiện nhanh chóng Mọi thơng tin người dùng lưu trư internet Mục tiêu nối mạng để người lưu trữ, sử dụng tài nguyên từ nhiều vị trí địa lý khác Tài nguyên bị phân tán dẫn tới dễ bị xâm phạm, gây mát liệu thơng tin có giá trị Điều vơ hình chung khiến cho internet trở thành thứ tốt nguy hiểm Nếu tài ngun khơng bảo vệ tốt gây nên thiệt hại lớn cho cá nhân tập thể Những hiểm họa thiệt hại phải gánh chịu không lường trước 1.2 Những nguy tiềm ẩn việc bảo mật nội dung số internet Mọi nguy mạng nguy tiềm tàng, từ lỗ hổng bảo mật nhỏ hệ thống bị khai thác lợi dụng trở thành tai họa khôn lường Theo thống kê CERT (Computer Emegancy Response Team) – Tổ chức bảo mật tiếng giới, số vụ cơng ngày tăng tăng mạnh thời gian tới, thiết hại gây ngày nghiêm trọng Điều dễ hiểu thực thể ln tồ hai mặt đối lập, công nghệ kỹ thuật 36 cho truy vấn tạo Đối với giá trị băm dấu vân tài liệu, số truy vấn danh sách dấu vân kết hợp lấy Số điểm chung (giá trị băm) tài liệu cần truy vấn giá trị băm tài liệu gốc lưu CSDL điểm để xác định tài liệu tương ứng với khơng? 2.4 Thuật tốn kiểm tra dấu vân tay tài liệu - Rabin Fingerprint Thuật tốn Rabin Fingerprint thuật tốn tính dấu vân tay thực khóa cơng khai Thuật tốn vân tay điển hình Rabin tạo số nguyên (giá trị băm) từ chuỗi trang web, giải pháp nhanh dễ dàng thực hiện, kèm với phân tích tốn học xác xác suất va chạm (hai tập tin có dấu vân tay giống nhau) Thuật toán Rabin Fingerprint sử dụng hệ thống sau: Đầu vào: Các tập tin văn phần nội dung trích từ trang web Đầu ra: Các số nguyên (giá trị băm) văn Bước 1: Bắt đầu Bước 2: Xử lý văn bản, xoá hết tất khoảng trắng từ trang web, ký tự đặc biệt (như:,%,!,…) Bước 3: Chia văn thành khối văn có chiều dài K Số chuỗi số mã băm chuỗi phải m-K+1 với m kích thước văn Bước 4: Tính giá trị băm H(P) cho chuỗi sau: Khởi tạo: Count=K; Tr = T[r r+n-1] H(S) = S(n)+2*S(n-1)+4*S(n-2)+ … + 2n-1*S(1) Do while count>0 Tính Hp(P) = H(P) mod p // giá trị băm P 37 Tính Hp(Tr) = [2*Hp(Tr-1)-(2nmodp)*T[r-1]+T[r+n-1]]mod p//Tính giá trị băm cho chuỗi Until count=1 Bước 5: Lưu lại tất giá trị băm văn Bước 6: Kết thúc Hình 2.6 Minh hoạ giải thuật Rabin Fingerprint 2.5 Kết luận chương Trong chương luận văn phân tích đánh giá số khái niệm bản, mơ hình Web Vấn đề bảo mật Web Tiếp cận cách sử dụng Dấu vân tay tài liệu (Document Fingerprint) việc theo dõi thay đổi nội dung trang Web Trong chương tiếp theo, tác giả đề xuất xây dựng hệ thống phát thay đổi nội dung trang web dựa cải tiến thuật giải Rabin Fingerprint 38 Chương XÂY DỰNG HỆ THỐNG PHÁT HIỆN THAY ĐỔI NỘI DUNG TRANG WEB 3.1 Đề xuất cải tiến giải thuật Rabin Fingerprint Thuật toán cải tiến Rabin Fingerprint đề xuất hệ thống sau: Đầu vào: Các tập tin văn phần nội dung trích từ trang web Đầu ra: Các số nguyên (giá trị băm) văn Bước 1: Bắt đầu Bước 2: Xử lý văn bản, xoá hết tất khoảng trắng từ trang web, ký tự đặc biệt (như:,%,!,…) Bước 3: Chia văn M thành K khối, khối có kích thước n K=m/n với m kích thước văn M, n số nguyên dương cho trước kích thước chuỗi Bước 4: Tính mã băm H(P) cho chuỗi sau: Khởi tạo: Tr = T[r r+n-1]; K=0; H(S) = S(n)+2*S(n-1)+4*S(n-2)+ … + 2n-1*S(1) while (K

Ngày đăng: 26/06/2017, 08:36

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan