Trực quan hóa mạng trích dẫn các bài báo khoa học: luận văn thạc sĩ

60 257 1
Trực quan hóa mạng trích dẫn các bài báo khoa học: luận văn thạc sĩ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

http:123link.proV8C5MỤC LỤCCHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU............................................11.1 Giới thiệu về đề tài ................................................................................................11.2 Mục tiêu của đề tài ................................................................................................21.3 Đối tượng và phạm vi nghiên cứu.........................................................................31.3.1 Đối tượng nghiên cứu.........................................................................................31.3.2 Phạm vi nghiên cứu............................................................................................31.4 Phương pháp nghiên cứu.......................................................................................31.4.1 Nội dung thực hiện..........................................................................................31.4.2 Phương pháp thực hiện ...................................................................................31.5 Ý nghĩa của đề tài..................................................................................................4CHƯƠNG 2: CÁC KIẾN THỨC LIÊN QUAN ............................................................52.1 Cơ sở dữ liệu đồ thị Neo4j ....................................................................................52.1.1 Cơ sở dữ liệu đồ thị.........................................................................................52.1.1.1 Tổ chức quan hệ đồ thị .............................................................................62.1.1.2 Gán nhãn các Node...................................................................................62.1.1.3 Truy vấn đồ thị bằng cách duyệt...............................................................62.1.1.4 Lập chỉ mục cho các Node hoặc Relationship..........................................7

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐỒN TẤN PHÁT TRỰC QUAN HĨA MẠNG TRÍCH DẪN CÁC BÀI BÁO KHOA HỌC LUẬN VĂN THẠC CÔNG NGHỆ THÔNG TIN Đồng Nai, năm 2017 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐOÀN TẤN PHÁT TRỰC QUAN HĨA MẠNG TRÍCH DẪN CÁC BÀI BÁO KHOA HỌC Chuyên ngành: Công nghệ thông tin Mã số: 60.48.02.01 LUẬN VĂN THẠC CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: PGS.TS ĐỖ PHÚC Đồng Nai, năm 2017 LỜI CẢM ƠN Những kiến thức luận văn kết hoạt động tự nghiên cứu q trình cơng tác hai năm học Cao học Công nghệ thông tin (2015 - 2017) Trường Đại học Lạc Hồng Dưới giảng dạy, đào tạo dìu dắt trực tiếp thầy cô trường Trước tiên, xin bày tỏ kính trọng lòng biết ơn chân thành, lời cảm ơn sâu sắc thầy PGS.TS Đỗ Phúc, người trực tiếp hướng dẫn, định hướng cho giải vấn đề luận văn Tôi xin bày tỏ lời cảm ơn chân thành tới quí thầy cô Khoa Công nghệ thông tin, Khoa sau đại học Trường Đại học Lạc Hồng, tạo điều kiện thuận lợi cho thời gian học tập trường Tôi xin cảm ơn đến Ban Lãnh đạo, anh chị đồng nghiệp Trường Đại Học FPT, người thân, bạn bè bạn đồng môn lớp cao học, ủng hộ giúp đỡ trình làm luận văn tốt nghiệp Xin trân trọng cảm ơn! Đồng Nai, ngày 20 tháng 10 năm 2017 Học viên Đồn Tấn Phát LỜI CAM ĐOAN Tơi cam đoan Luận văn Thạc “TRỰC QUAN HĨA MẠNG TRÍCH DẪN CÁC BÀI BÁO KHOA HỌC” cơng trình nghiên cứu độc lập, tơi hồn thành Các nội dung nghiên cứu, kết luận văn trung thực chưa công bố hình thức trước Những số liệu bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá thu thập từ công việc thực tế phát sinh đơn vị, tài liệu mà tơi tham khảo có nguồn gốc trích dẫn rõ ràng Tơi xin chịu hồn tồn trách nhiệm lời cam đoan Đồng Nai, ngày 20 tháng 10 năm 2017 Học viên ĐOÀN TẤN PHÁT MỤC LỤC CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU 1.1 Giới thiệu đề tài 1.2 Mục tiêu đề tài 1.3 Đối tượng phạm vi nghiên cứu 1.3.1 Đối tượng nghiên cứu 1.3.2 Phạm vi nghiên cứu 1.4 Phương pháp nghiên cứu 1.4.1 Nội dung thực 1.4.2 Phương pháp thực 1.5 Ý nghĩa đề tài CHƯƠNG 2: CÁC KIẾN THỨC LIÊN QUAN 2.1 Cơ sở liệu đồ thị Neo4j 2.1.1 Cơ sở liệu đồ thị 2.1.1.1 Tổ chức quan hệ đồ thị 2.1.1.2 Gán nhãn Node 2.1.1.3 Truy vấn đồ thị cách duyệt 2.1.1.4 Lập mục cho Node Relationship 2.1.1.5 Neo4j sở liệu đồ thị 2.1.2 Cơ sở liệu Neo4j 2.1.2.1 Nodes 2.1.2.2 Relationships 2.1.2.3 Properties 11 2.1.2.4 Nhãn 12 2.1.2.5 Đường dẫn 13 2.2 Ngôn ngữ truy vấn Cypher 15 2.2.1 Tổng quan Cypher 15 2.2.2 Tham số 17 2.2.3 Giao dịch (transaction) 18 2.2.4 Cú pháp 18 2.2.4.1 Toán tử 18 2.2.4.2 Biểu thức 18 2.2.5 Mệnh đề 19 2.2.5.1 Mệnh đề RETURN 19 2.2.5.2 Mệnh đề ORDER BY 20 2.2.5.3 Mệnh đề LIMIT 20 2.2.5.4 Mệnh đề SKIP 20 2.2.5.5 Mệnh đề WHERE 21 2.3 Lý thuyết mạng trích dẫn 21 2.3.1 Đặc điểm mạng trích dẫn 22 2.3.2 Một số khái niệm mạng trích dẫn 22 2.3.2.1CitedSet 22 2.3.2.2 CitingSet 23 2.3.2.3 Full Graph 25 2.3.3 Lợi ích mạng trích dẫn: 22 2.4 GraphStream 27 2.4.1 Tổng quan GraphStream 27 2.4.2 Sử dụng GraphStream 28 2.4.2.1 Cài đặt 28 2.4.2.2 Sử dụng graphStream 28 CHƯƠNG 3: PHÂN TÍCH VÀ THIẾT KẾ ỨNG DỤNG 31 3.1 Phân tích yêu cầu ứng dụng 31 3.2 Thiết kế ứng dụng 32 3.2.1 Chuẩn hóa sở liệu 32 3.2.2 Tạo sở liệu đồ thị Neo4j 35 3.2.3 Tìm kiếm mạng trích dẫn 36 3.2.4 Trực quan 37 CHƯƠNG 4: HIỆN THỰC HỆ THỐNG VÀ THỬ NGHIỆM 39 4.1 Yêu cầu thực nghiệm 39 4.2 Chạy chương trình 40 4.2.1 Thao tác với liệu 41 4.2.2 Trực quan đồ thị 44 CHƯƠNG 5: Kết luận 50 5.1 Kết luận 50 5.2 Những thiếu sót luận văn 50 5.3 Hướng phát triển 50 DANH MỤC HÌNH ẢNH Hình 1.1 Mạng trích dẫn Hình 2.1: Đồ thị nhiều Node Relationship Hình 2.2: Truy vấn đồ thị cách duyệt Hình 2.3: Lập mục cho Node Relationship Hình 2.4: Cơ sở liệu đồ thị Neo4j Hình 2.5: Các Node Hình 2.6: Một Node có thuộc tính Hình 2.7: Relationships 10 Hình 2.8: Quan hệ hai Node 10 Hình 2.9: Quan hệ vào/ra Node 10 Hình 2.10: Quan hệ loop 11 Hình 2.11: Các kiểu Relationship 11 Hình 2.12: Properties 12 Hình 2.13: Nhãn 13 Hình 2.14: Paths 14 Hình 2.15: Path có chiều dài 14 Hình 2.16: Path có chiều dài 14 Hình 2.17: Đồ thị có nhiều quan hệ liên kết với 16 Hinh 2.18: Đồ thị đơn giản 19 Hình 2.19: Trích dẫn ln ln ngược với thời gian 22 Hình 2.20: Kết CitedSet 23 Hình 2.21: Kết CitingSet 24 Hình 2.22: Kết Full Graph 25 Hình 2.23: Trích dẫn ln ngược với thời gian 26 Hình 2.24: Tác giả lĩnh vực 27 Hình 2.25: Xu hướng mạng trích dẫn 27 Hình 3.1: Mô tả tổng quan hoạt động ứng dụng 31 Hình 3.2: Bảng liệu file csv 34 Hình 4.1 Hướng dẫn mở chương trình trực quan 40 Hình 4.2: Giao diện ứng dụng 41 Hình 4.3: Giao diện thao tác với file text 42 Hình 4.4: Giao diện nơi lưu file csv 42 Hình 4.5: Giao diện chọn file csv để chuyển sang neo4j 43 Hình 4.6: Giao diện chọn file csv để chuyển sang neo4j 43 Hình 4.7: Giao diện nơi lưu file database neo4j 44 Hình 4.8: Kết trực quan Cited set 45 Hình 4.9: kết dạng text Cited set 46 Hình 4.10: Kết trực quan Citing set 46 Hình 4.11 Kết dạng text Citingset 47 Hình 4.12 Kết trực quan full graph 48 Hình 4.13 Kết dạng text full graph 48 Hình 4.14 Kết trực quan mối quan hệ hai báo 49 DANH MỤC BẢNG BIỂU Bảng 2.1: kết trả tất node đồ thị 20 Bảng 4.1: Các thơng số cấu hình phần cứng hệ điều hành 39 Bảng 4.2: Các thơng số cấu hình phần mềm 40 CHƢƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU 1.1 Giới thiệu đề tài Hiện nay, với phát triển vượt bậc mạng Internet, việc tìm kiếm tài liệu trở nên dễ dàng Tuy nhiên làm nghiên cứu, nhà nghiên cứu cần đọc tài liệu nhiều ln muốn biết, phần mà họ nghiên cứu có báo liên quan với trích dẫn đâu Nhưng việc truy xuất nguồn gốc tìm kiếm để xác định mối liên hệ báo khoa học khó khăn Với số lượng báo khoa học năm nhiều, liệu lúc lớn dần theo thời gian Điều gây nhiều khó khăn việc lưu trữ truy xuất cần Mạng trích dẫn báo khoa học đồ thị lớn, nên sở liệu đồ thị neo4j với khả lưu trữ truy vấn đồ thị sử dụng để lưu trữ mạng trích dẫn Cơ sở liệu đồ thị Neo4j phần mềm quản trị sở liệu đồ thị mã nguồn mở, viết Java, phát hành vào năm 2010 Neo4j sở liệu đồ thị lưu trữ liệu đồ thị.[5] Luận văn nhằm giải việc lưu trữ liệu đồ thị biểu diễn cách truy xuất kết nối liệu lớn cách sinh động dễ hình dung o Tình hình ngồi nước: - Trên giới, lưu trữ liệu lớn với sở liệu đồ thị ngày nghiên cứu sử dụng cách rộng rãi - Egghe & Rousseau (1990, p 228), giải thích, tài liệu A trích dẫn tài liệu B, thể điều mũi tên từ nút đại diện cho tài liệu A đến nút đại diện cho tài liệu B Bằng cách văn gôm thành đồ thị có hướng, gọi đồ thị trích dẫn mạng trích dẫn.[7] ... HỒNG ĐỒN TẤN PHÁT TRỰC QUAN HĨA MẠNG TRÍCH DẪN CÁC BÀI BÁO KHOA HỌC Chuyên ngành: Công nghệ thông tin Mã số: 60.48.02.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: PGS.TS ĐỖ... lưu trữ liệu báo khoa học Tạo mạng trích dẫn báo khoa học với khoảng 10.000 báo 1.4 Phƣơng pháp nghiên cứu 1.4.1 Nội dung thực - Tạo mạng trích dẫn báo khoa học - Lưu mạng trích dẫn vào sở liệu... hướng, gọi đồ thị trích dẫn mạng trích dẫn. [7] Hình 1.1 Mạng trích dẫn Hình 1.1 hiển thị mạng trích dẫn, ban đầu cơng bố báo thuộc lĩnh vực thuốc gây mê(Cawkell, 1971) Mạng trích dẫn minh họa kết

Ngày đăng: 01/11/2018, 11:00

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan