Đề tài lập chỉ mục theo nhóm để nâng cao hiệu quả khai thác cơ sở dữ liệu virus cúm

33 357 0
Đề tài lập chỉ mục theo nhóm để nâng cao hiệu quả khai thác cơ sở dữ liệu virus cúm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC MỤC LỤC DANH MỤC HÌNH ẢNH TÓM TẮT CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN 1 1.1 Đặt vấn đề: 1 1.2 Tình hình phát triển: 1 1.3 Mục tiêu đề tài: 7 CHƯƠNG 2: SỞ LÝ THUYẾT 9 2.1 Giới thiệu tổng quan: 9 2.2 Giới thiệu công nghệ LinQ – Visual 2008: 9 2.2.1 Giới Thiệu: 9 2.2.2 Giới thiệu mô hình ba lớp LinQ: 9 2.2.2.1 Giới thiệu: 9 2.2.2.2 Demo: 10 2.3 Lập chỉ mục theo nhóm: 11 2.4 Các ứng dụng tích hợp vào website: 11 2.4.1 Sắp hàng đa trình tự sinh học và biểu diễn theo dạng cây sinh học 11 2.4.2 Hiển thị thông tin và tìm kiếm thông tin virus cúm: 12 2.4.3 Biểu diễn thông tin virus cúm trên bản đồ: 12 2.3.4 Lưu trữ, hiển thị và tìm kiếm thông tin gen: 12 CHƯƠNG 3: XÂY DỰNG WEBSITE QUẢN LÝ THÔNG TIN SINH Y HỌC 13 3.1 Xây dựng mô hình sở dữ liệu website quản lý thông tin sinh học: 13 3.1.1. Tham khảo các website trong và ngoài nước: 13 3.1.2 Xây dựng mô hình sở dữ liệu: 15 3.2 Xây dựng website hiển thị thông tin sinh học (user interface – UI): 15 3.2.1 Bảng tổng hợp các module chức năng: 15 3.2.2 Thiết kế giao diện: 15 3.3 Xây dựng chức năng ứng dụng vào website quản lý thông tin sinh học: 1 20 3.3.1 Hiển thị thông tin virus cúm 20 3.3.2 Lưu trữ, hiển thị và tìm kiếm thông tin gene sinh học: 20 3.3.3 Thiết kế giao diện hiển thị và tìm kiếm thông tin gene 22 3.4 Tích hợp liên kết các chức năng vào website quản lý thông tin sinh học: 23 3.4.1 Tìm kiếm thông tin virus cúm: 23 3.4.2 Tra cứu thông tin virus cúm: 24 3.4.3 Biểu diễn thông tin virus cúm trên google map: 24 CHƯƠNG 4: KẾT LUẬN 25 4.1 Những kết quả đạt được: 25 4.2 Ưu điểm của trang website: 25 4.3 Hướng phát triển: 25 TÀI LIỆU THAM KHẢO 26 2 DANH MỤC HÌNH ẢNH Hình 1.1:Trang chủ của bme.vn 2 Hình 1.2:Trang chủ của thietbiysinh.com 3 Hình 1.3:Trang chủ sinh học Việt Nam 4 Hình 1.4:Trang chủ của NCBI 5 Hình 1.5:trang chủ của biomedical 5 Hình 1.6:trang chủ của obofoundry 6 Hình 1.7:trang chủ của flukebiomedical 7 Hình 2.1:Tài khoản 10 Hình 2.2:cơ sở dữ liệu LinQ file *.dbml 10 Hình 2.3: Mô hình sở dữ liệu thông tin virus cúm 12 Hình 3.1: trang chủ sinh học Việt Nam 13 Hình 3.2: trang chủ NCBI 14 Hình 3.3:Mô hình sở dữ liệu MS SQL 15 Hình 3.4:Trang chủ 16 Hình 3.5: Trang tin tức 16 Hình 3.6: Trang sinh học 17 Hình 3.7: Trang chi tiết tin tức 18 Hình 3.8: Trang chi tiết nghiên cứu khoa học 19 Hình 3.9: hiển thị virus cúm 20 Hình 3.10: Minh họa 1 file kết quả thu được sau khi tìm kiếm trình tự Nucleotic trên NCBI dạng FASTA 20 Hình 3.11: Minh họa một file kết quả thu được sau khi tìm kiếm trình tự Aminoacid do CDS mã hóa trên NCBI dạng FASTA. 21 Hình 3.12: Kết quả tổng hợp trình tự Nucleotide sau khi tìm kiếm 21 Hình 3.13: Trang Gene Admin 22 Hình 3.14: giao diện thông tin gene 22 Hình 3.15: Giao diện công cụ tìm kiếm trình tự sinh học 23 Hình 3.16. Giao diện chức năng tìm kiếm BLASTN 23 Hình 3.17: Trang chủ tìm kiếm virus cúm 24 Hình 3.18: trang chủ biểu diễn thông tin virus cúm 24 3 TÓM TẮT Đề tài “Lập chỉ mục theo nhóm để nâng cao hiệu quả khai thác sở dữ liệu virus cúm” là đề tài được đưa ra nhằm mục đích đem ứng dụng thực tiễn để lưu trữ những thông tin phổ thông về sinh học và những thông tin về các nghiên cứu khoa học về sinh học đồng thời giúp cho việc khai thác sở dữ liệu sinh học, đặc biệt là sở dữ liệu virus cúm, hi ệu quả và tiện lợi bằng cách dùng phương pháp lập chỉ mục theo nhóm. Đề tài cũng xây dựng thành công website quản lý sinh học, cung cấp cho người dùng những thông tin về sinh học và hỗ trợ cho những người nghiên cứu sinh học những công cụ hỗ trợ trong quá trình nghiên cứu sinh học như: sắp hàng đa trình tự sinh học, biễu diễn – tìm kiếm thông tin virus cúm, so sánh cấu trúc protein … Website sẽ là nơi được những nhà quản trị thu thập và lưu tr ữ những thông tin, dữ liệu nghiên cứu về sinh học. Là môi trường để liên kết, tích hợp những ứng dụng trong nghiên cứu sinh học. 4 CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN • Đặt vấn đề: Việc ứng dụng công nghệ thông tin vào lĩnh vực y học và sinh học đã được tiến hành từ rất lâu. Nhưng để công cộng hoá và tạo những dịch vụ ứng dụng gần gũi, dễ sử dụng thì gặp rất nhiều hạn chế. Những người sử dụng chủ yếu là các bác sĩ, những nhà nghiên cứu khoa học hoạt động trong l ĩnh vực sinh học, y học. Do vậy với sự bùng nổ của cộng nghệ thông tin và mạng internet đã giúp cho mọi người bình thường thể tiếp cận một cách dễ dàng hơn với công nghệ sinh tin học. Việc áp dụng Công nghệ thông tin vào giải quyết các bài toán trong sinh học là một lĩnh vực mới trên thế giới cũng như ở Việt Nam. Đã rất nhiều nghiên cứu về sinh học đ ã được tiến hành ở Việt Nam, nhưng các nghiên cứu chủ yếu tập trung vào việc giải mã các trình tự DNA và protein, qua đó tiến hành một số phân tích để tìm hiểu mối quan hệ giữa chúng. Hiện nay chúng ta còn thiếu một hệ thống thông tin giúp các nhà quản lý như bộ, sở ngành y tế, các nhà chuyên môn và người dân được thông tin, dữ liệu cũng như công cụ phân tích về sinh học, đặc biệt là ở Việt Nam. Chính vì vậy đề tài “Lập ch ỉ mục theo nhóm để nâng cao hiệu quả khai thác sở dữ liệu virus cúm” đáp ứng một phần tìm hiểu về thông tin sinh học ở Việt Nam. Với bài nghiên cứu này tác giả xây dựng một website nhằm quản lý thông tin sinh học và cung cấp các ứng dụng liên quan trong việc nghiên cứu sinh học, hơn nữa còn áp dụng cách lập chỉ mục theo nhóm để cho việc khai thác thông tin trở nên nhanh chóng và hiệu quả. •  Tình hình phát triể n: Trong nước: Hiện nay trong nước cũng đã một số đơn vị, tổ chức thực hiện xây dựng website nghiên cứu về sinh học. Đặc biệt là các bệnh viện và các trường đại học đào tạo về y khoa. Như: * http://www.bme.vn BMEVN được thành lập trước hết là để phục vụ cộng đồng. chủ trương đây là một trang thông tin mở, mọi người đóng góp cho website trên tinh thần tự nguyện và cũng được nhận các thông tin từ BMEVN miễn phí. Website được xây dựng từ kinh phí của ban quản trị và các nguồn tài trợ. Trong tương lai thể sẽ thương mại hóa ở một mức độ nào đó nhằm tạo nguồn kinh phí mở rộng và phát tri ển 5 website. Tuy nhiên, những nội dung đóng góp miễn phí cho BMEVN sẽ trở thành kho tư liệu được cung cấp hoàn toàn miễn phí cho cộng đồng. Hình 1.:Trang chủ của bme.vn Nội dung chủ đạo mà BMEVN hướng đến là phục vụ cho giáo dục, đào tạo và cung cấp thông tin cho cộng đồng. Trước mắt, chúng tôi sẽ tập trung chính vào 3 mảng sau: + Những kiến thức bản và chuyên sâu liên quan đến lĩnh vực kỹ thuật y sinh. + Giới thiệu những sản phẩm, công nghệ mới được phát triển, ứng dụng tại Việt Nam và Thế giới. + Trao đổi tài liệu với mục đích học tập, nghiên cứu.Ngoài ra để website phản ánh sát thực tế, chúng tôi cũng hướng đến các nội dung: + Những tin tức mới liên quan đến sự phát triển của ngành Kỹ thật y sinh tại Việt Nam. + Thông tin giao lưu, trao đổi. * http://www.thietbiysinh.com.vn Website này cung cấp cho người xem những thông tin mới nhất trong lĩnh vực y sinh, những ứng dụng kỹ thuật hiện đại vào phương pháp chẩn đoán y học và phương pháp điều trị bệnh tật. Ngoài ra cũng cung cấp những kiến thức bản về y học trong đời sống thường ngày, giúp cho người xem thể tự bảo vệ sức 6 khỏe, tránh nhiều bệnh tật. Hình 1.:Trang chủ của thietbiysinh.com Website cũng tạo điều kiện bạn đọc gửi những thông tin, kiến thức về sinh học, về kỹ thuật y sinh của mình để giúp cho người truy cập thêm những thông tin về lĩnh vực này. Đồng thời bạn cũng thể gửi lên website những thắc mắc của mình về lĩnh vực sinh học, chúng tôi sẽ trả lời trong sự hiểu biết của mình một cách nhanh nhất cho bạn. * http://www.sinhhocvietnam.com: Sinh học Việt Nam (SHVN) là một Website tự nguyện và phi thương mại, được định hướng là sân chơi chuyên ngành nghiêm túc và thuần túy khoa học dành cho tất cả những người Việt Nam đang học tập, công tác trong các lĩnh vực Sinh học. 7 Hình 1.:Trang chủ sinh học Việt Nam Website Sinh học Việt Nam (http://sinhhocvietnam.com) được định hướng là nơi hội tụ các nhà Sinh học người Việt đang sinh sống và làm việc khắp mọi nơi trên thế giới. Nguyên tắc hoạt động của SHVN là tự nguyện, dựa trên sự đóng góp của cộng đồng. Tất cả những nội dung trên SHVN là phi lợi nhuận.Tôn chỉ của SHVN là nghiêm túc và thuần tuý chuyên môn. Ngoài ra còn một số website khác như: - http://www.ibt.ac.vn/ - http://www.itb.ac.vn/vn/ - http://www.ykhoanet.com/ Ngoài nước: * http://www.ncbi.nlm.nih.gov 8 Hình 1.:Trang chủ của NCBI Là trang trung tâm thông tin quốc gia về công nghệ sinh học, nơi cung cấp thông tin, dữ liệu sở cho công đồng, quản lý các nghiên cứu khoa học trong lĩnh vực sinh học tính toán và phát triển các công cụ phần mềm cho phân tích dữ liệu. Là một thư viện khổng lồ về sinh học. * http://biomedical.com 9 Hình 1.:trang chủ của biomedical Biomedical là trang web chuyên phân tích các mẫu nuleotit và gene được cung cấp từ các phòng nghiên cứu trên thế giới. * http://www.obofoundry.org : chuyên cung cấp các thí nghiệm thực thể liên quan đến lĩnh vực sinh học.trang web cũng phân tích các mẫu tiến trình. Đây cũng là nơi thảo luận về sở hạ tầng, các dich vụ, các công nghệ mới trong lĩnh vực này. 10

Ngày đăng: 10/12/2013, 18:06

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan