ỨNG DỤNG THUẬT TOÁN BURROWSWHEELER TRANSFORM TRONG QUÁ TRÌNH GIẢI MÃ HỆ GEN LÚA TẠI VIỆT NAM

80 48 0
  • Loading ...
1/80 trang

Thông tin tài liệu

Ngày đăng: 09/07/2018, 15:09

Tin Sinh học (Bioinformatics) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh để giải quyết các vấn đề sinh học. Sự ra đời của Tin Sinh học là sự hợp tác chặt chẽ giữa các nhà Tin học và các nhà nghiên cứu Sinh học nhằm khai phá dữ liệu hiệu quả, Tin – Sinh học đã trở thành mục tiêu công nghệ của ngành Sinh học trong thế kỉ mới. Bắt kịp xu thế phát triển của khoa học thế giới, những năm gần đây các nhà Tin Sinh học Việt Nam đã xác định được những hướng đi phù hợp và đạt được thành công bước đầu với một số công trình nghiên cứu mang tính ứng dụng cao. Trong sinh học, việc giải mã trình tự gen rất quan trọng, nó góp phần trong việc nghiên cứu sinh học cơ bản và trong nhiều lĩnh vực ứng dụng như chẩn đoán bệnh tật, công nghệ sinh học, sinh học pháp y, sinh học hệ thống... Do đặc tính khí hậu nhiệt đới, Việt Nam có những lợi thế về những nguồn dữ liệu Sinh học to lớn, hữu ích, điều đó trở thành một điều kiện thuận lợi và cũng là thách thức cần đến sự đóng góp của Tin Sinh học.Nhận thấy tính mới mẻ trong lĩnh vực nghiên cứu Tin – Sinh học nói chung cũng như những ưu điểm phát triển của nghành Tin Sinh học nước nhà, học viên đã lựa chọn đề tài “ứng dụng thuật toán Burrow – Wheeler Tranform trong quá trình giải mã hệ gen lúa”. Luận văn bao gồm ba chương chính, nội dung tóm lược như sau:Chương 1 trình bày tổng quan và các khái niệm cơ bản trong sinh học phân tử, các định dạng dữ liệu trong bài toán Tin – Sinh học. Mục tiêu chính của chương này nhằm làm rõ các khái niệm giới thiệu vấn đề và nội dung sẽ trình bày trong chương tiếp theo của luận văn.Chương 2 trình bày quá trình giải mã hệ gen, bài toán gióng hàng trình tự trong việc giải mã hệ gen. Chương 2 sẽ nêu một số thuật toán cơ bản giải bài toán gióng hàng trình tự. Trọng tâm của chương 2 giới thiệu ý tưởng và quá trình xây dựng thuật toán Burrows–Wheeler Transform trong quá trình giải mã hệ gen.Chương 3 Trình bày về quá trình thực nghiệm và ứng dụng thuật toán trên dữ liệu sinh học. Tác giả tham gia cùng nhóm nghiên cứu thuộc phòng Tin – Sinh học, viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam xây dựng công cụ dóng hàng trình tự BWTAligner dựa trên thuật toán BWT đã tìm hiểu. Đối chứng kết quả khi dóng hàng trình tự trên công cụ dóng hàng phổ biến BWA. Trong chương này thực hiện từng bước chuẩn bị dữ liệu, cài đặt môi trường, sử dụng công cụ, đưa ra kết quả thực nghiệm và đánh giá kết quả của luận văn. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Vũ Thị Diệu ỨNG DỤNG THUẬT TỐN BURROWS-WHEELER TRANSFORM TRONG Q TRÌNH GIẢI HỆ GEN LÚA TẠI VIỆT NAM LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – Năm 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Vũ Thị Diệu ỨNG DỤNG THUẬT TOÁN BURROWS-WHEELER TRANSFORM TRONG QUÁ TRÌNH GIẢI HỆ GEN LÚA TẠI VIỆT NAM Chuyên ngành: Cơ sở toán cho tin học số: 60480104 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN CƯỜNG Hà Nội – Năm 2015 LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng Các số liệu nêu luận văn trung thực Những kết luận khoa học luận văn chưa công bố cơng trình khác Tơi xin chịu trách nhiệm nghiên cứu TÁC GIẢ LUẬN VĂN Vũ Thị Diệu LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới TS Nguyễn Cường, người tận tình giúp đỡ hướng dẫn tơi hồn thành luận văn này.Thầy định hướng giúp phương pháp nghiên cứu giúp bước tiếp cận với lĩnh vực Tin – Sinh học bổ ích vô mẻ Cho thêm đam mê động lực để hoàn thành luận văn cách tốt Tôi xin gửi lời cám ơn tới tập thể bạn, anh chị làm việc phòng Tin Sinh, thuộc Viện Công nghệ sinh học, Viện Hàn lâm KH&CN Việt Nam Cám ơn bạn, anh chị nhiệt tình giúp đỡ em thời gian qua, giúp em tiếp cận cách gần với môi trường thực tế ngành Tin – Sinh để em đưa kết nghiên cứu cách trực quan đầy đủ luận văn Tơi xin gửi lời cảm ơn chân thành tới thầy giáo ngồi trường Đại học Khoa học tự nhiên, bạn bè, đồng nghiệp gia đình giúp đỡ, động viên tơi q trình nghiên cứu, hồn thành luận văn Luận văn chắn khơng tránh khỏi thiếu sót Rất mong góp ý Thầy, Cơ đồng nghiệp đồng thời mong nhà nghiên cứu tiếp tục hiệu chỉnh, bổ sung Tôi xin chân thành cảm ơn! TÁC GIẢ LUẬN VĂN Vũ Thị Diệu MỤC LỤC DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG BIỂU MỞ ĐẦU Tin - Sinh học (Bioinformatics) lĩnh vực khoa học sử dụng cơng nghệ ngành tốn học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học hóa sinh để giải vấn đề sinh học Sự đời Tin - Sinh học hợp tác chặt chẽ nhà Tin học nhà nghiên cứu Sinh học nhằm khai phá liệu hiệu quả, Tin – Sinh học trở thành mục tiêu công nghệ ngành Sinh học kỉ Bắt kịp xu phát triển khoa học giới, năm gần nhà Tin - Sinh học Việt Nam xác định hướng phù hợp đạt thành cơng bước đầu với số cơng trình nghiên cứu mang tính ứng dụng cao Trong sinh học, việc giải trình tự gen quan trọng, góp phần việc nghiên cứu sinh học nhiều lĩnh vực ứng dụng chẩn đoán bệnh tật, công nghệ sinh học, sinh học pháp y, sinh học hệ thống Do đặc tính khí hậu nhiệt đới, Việt Nam có lợi nguồn liệu Sinh học to lớn, hữu ích, điều trở thành điều kiện thuận lợi thách thức cần đến đóng góp Tin - Sinh học Nhận thấy tính mẻ lĩnh vực nghiên cứu Tin – Sinh học nói chung ưu điểm phát triển nghành Tin - Sinh học nước nhà, học viên lựa chọn đề tài “ứng dụng thuật toán Burrow – Wheeler Tranform trình giải hệ gen lúa” Luận văn bao gồm ba chương chính, nội dung tóm lược sau: Chương trình bày tổng quan khái niệm sinh học phân tử, định dạng liệu toán Tin – Sinh học Mục tiêu chương nhằm làm rõ khái niệm giới thiệu vấn đề nội dung trình bày chương luận văn Chương trình bày trình giải hệ gen, tốn gióng hàng trình tự việc giải hệ gen Chương nêu số thuật toán giải tốn gióng hàng trình tự Trọng tâm chương giới thiệu ý tưởng trình xây dựng thuật tốn Burrows–Wheeler Transform q trình giải hệ gen Chương Trình bày trình thực nghiệm ứng dụng thuật toán liệu sinh học Tác giả tham gia nhóm nghiên cứu thuộc phòng Tin – Sinh học, viện Cơng nghệ Sinh học, Viện Hàn lâm Khoa học Công nghệ Việt Nam xây dựng cơng cụ dóng hàng trình tự BWTAligner dựa thuật tốn BWT tìm hiểu Đối chứng kết dóng hàng trình tự cơng cụ dóng hàng phổ biến BWA Trong chương thực bước chuẩn bị liệu, cài đặt môi trường, sử dụng công cụ, đưa kết thực nghiệm đánh giá kết luận văn CHƯƠNG 1: CƠ SỞ LÝ THUYẾT Tin - Sinh học lĩnh vực mẻ phạm vi nghiên cứu Việt Nam Những năm gần đây, Tin - Sinh học nhà nghiên cứu Việt Nam tiếp cận gần đạt thành công bước đầu trội Trong chương đầu luận văn, tác giả giới thiệu đến khái niệm Tin - Sinh học, hướng phát triển Tin – Sinh học nói chung Việt Nam nói riêng, từ làm tiền đề để phát biểu mục tiêu luận văn Phần cuối chương trình bày định nghĩa toán Tin – Sinh học nhắc đến xuyên suốt phần sau luận văn 1.1 Đặt vấn đề 1.1.1 Tin – Sinh học Tin - Sinh học (Bioinformatics) lĩnh vực khoa học sử dụng cơng nghệ ngành tốn học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học hóa sinh để giải vấn đề sinh học Tin - Sinh học thiên việc phát triển giải thuật, lý thuyết kĩ thuật thống kê tính tốn để giải tốn bắt nguồn từ nhu cầu quản lí phân tích liệu sinh học Những lĩnh vực nghiên cứu Tin - Sinh học gồm phân tích trình tự, tìm kiếm gen, tìm kiếm đột biến, phân tích chức gen …vv Mọi sinh vật có hệ gen, người ta khẳng định hệ gen hóa hầu hết thơng tin di truyền sinh vật Do vậy, việc giải hệ gen tốn có ý nghĩa vơ quan trọng ngành sinh học giới nói chung, với nước phát triển Việt Nam nói riêng Giải trình tự gen tốn có quy mơ rộng lớn ngành Tin – Sinh học đem lại thành tựu nghiên cứu có ý nghĩa vơ to lớn: Năm 2003, thành công dự án giải 1000 hệ gen người (Human Genome Project ) mang tới bước đột phá lớn sinh học công nghệ, khởi đầu cho 10 ... (Cytosine) Máy giải trình tự hệ (Next-generation sequencing) giải trình tự tồn hệ gen Máy giải trình tự khơng tạo chuỗi trình tự tồn hệ gen, mà tạo hàng triệu đoạn trình tự nhỏ cắt từ hệ gen, gọi trình. .. thiệu thuật toán Burrows – Wheeler Tranform (BWT) nhằm giải hiệu toán gióng hàng trình tự cách nhanh chóng, xác hiệu 2.1 Quy trình giải mã hệ gen tốn gióng hàng trình tự 2.1.1 Giải mã hệ gen quy trình. .. TỰ NHIÊN - Vũ Thị Diệu ỨNG DỤNG THUẬT TỐN BURROWS-WHEELER TRANSFORM TRONG Q TRÌNH GIẢI MÃ HỆ GEN LÚA TẠI VIỆT NAM Chuyên ngành: Cơ sở toán cho tin học Mã số: 60480104 LUẬN VĂN THẠC SĨ
- Xem thêm -

Xem thêm: ỨNG DỤNG THUẬT TOÁN BURROWSWHEELER TRANSFORM TRONG QUÁ TRÌNH GIẢI MÃ HỆ GEN LÚA TẠI VIỆT NAM, ỨNG DỤNG THUẬT TOÁN BURROWSWHEELER TRANSFORM TRONG QUÁ TRÌNH GIẢI MÃ HỆ GEN LÚA TẠI VIỆT NAM, CHƯƠNG 1: CƠ SỞ LÝ THUYẾT, CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ THUẬT TOÁN, 2 Một số thuật toán cơ bản cho bài toán gióng hàng trình tự, Hình 2.9 Tính chuỗi chuyển đổi BWT, Bảng 2.1 Bảng C(α): số lần xuất hiện của những kí tự nhỏ hơn kí tự α trong X, Hình 2.15 Kết quả của quá trình tìm kiếm W=”gca”, CHƯƠNG 3 : ỨNG DỤNG THUẬT TOÁN BWT VÀ THỬ NGHIỆM TRÊN DỮ LIỆU SINH HỌC, 5 Đánh giá kết quả của luận văn

Từ khóa liên quan

Mục lục

Xem thêm

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay