Hợp tác nghiên cứu ứng dụng tin sinh học trong phát triển dịch tễ học phân tử một số virut gây bệnh ở người

109 720 2
Hợp tác nghiên cứu ứng dụng tin sinh học trong phát triển dịch tễ học phân tử một số virut gây bệnh ở người

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xuất phát từnhững đòi hỏi cấp bách và thực tiễn của ngành Tin sinh học Việt Nam, với định hướng phát triển và ứng dụng công nghệTin sinh học trong nghiên cứu dịch tễhọc phân tử, nhiệm vụhợp tác quốc tếgiữa Viện Vệsinh Dịch tễTƯvà Viện Pasteur Paris, Pháp “Hợp tác nghiên cứu ứng dụng Tin sinh học trong dịch tễhọc phân tửmột sốvirút gây bệnh nguy hiểm ởngười” đã được triển khai nhằm đạt hai mục tiêu chính: 1. Hợp tác nghiên cứu và chuyển giao công nghệTin sinh học (Bioinformatic) ứng dụng trong Dịch tễhọc phân tửmột sốvirút gây bệnh ởngười. 2. Ứng dụng Tin sinh học trong nghiên cứu đặc điểm genotyp của một sốchủng virút (Rubella, sởi) lưu hành tại các vùng địa lý dân cưkhác nhau. Việc xây dựng các ứng dụng Tin sinh học hỗtrợtrong nghiên cứu và chuyển giao công nghệTin sinh học là vô cùng cần thiết, qua đó giúp chúng ta nhanh chóng hoà nhập với cộng đồng ngoài nước, mởra cơhội hợp tác nghiên cứu khoa học với các nước trong khu vực và trên thếgiới. Hơn thế, việc ứng dụng rộng rãi và thành công của Tin sinh học trong nhiều lĩnh vực Sinh học đóng góp phần thiết yếu trong việc thúc đẩy phát triển nền Sinh học của một Quốc gia MỤC LỤC MỞ ĐẦU 1 Chương 1. TỔNG QUAN 3 1.1. CÔNG NGHỆTIN SINH HỌC 3 1.1.1. Khái niệm vềTin sinh học 3 1.1.2. Lĩnh vực nghiên cứu chính của tin sinh học 4 1.1.2.1. Phân tích trình tự 4 1.1.2.2. Tìm kiếm gen 5 1.1.2.3. Dò tìm đột biến 5 1.1.2.4. So sánh trình tự 6 1.1.2.5. Bảo tồn đa dạng sinh học 6 1.1.3. Công cụphần mềm Tin sinh học 7 1.1.3.1. Phần mềm Tin sinh học miễn phí 7 1.1.3.2. Phần mềm Tin sinh học thương mại 8 1.1.3.3. Phần mềm Tin sinh học bản quyền BioNumerics 8 1.2. ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU DỊCH TỄHỌC PHÂN TỬBỆNH ỞNGƯỜI 9 1.2.1. Khái niệm vềDịch tễhọc phân tử 9 1.2.2. Dịch tễhọc phân tửbệnh sởi 11 1.2.2.1. Virút sởi 11 1.2.2.2. Nghiên cứu dịch tễhọc phân tửbệnh sởi 11 1.2.3. Dịch tễhọc phân tửbệnh Rubella 14 1.2.3.1. Virút Rubella 14 1.2.3.2. Nghiên cứu dịch tễhọc phân tửbệnh Rubella 15 1.2.4. Ứng dụng Tin sinh học trong nghiên cứu Dịch tễhọc phân tử 16 Chương 2- PHƯƠNG PHÁP NGHIÊN CỨU 19 2.1. CHUYỂN GIAO CÔNG NGHỆTIN SINH HỌC ỨNG DỤNG TRONG NGHIÊN CỨU DỊCH TỄHỌC PHÂN TỬVIRÚT GÂY BỆNH ỞNGƯỜI 19 2.1.1. Đào tạo và chuyển giao Công nghệTin sinh học tại Pháp 19 2.1.1.1. Đào tạo kiến thức vềCông nghệTin sinh học 19 2.1.1.2. Chuyển giao Công nghệTin sinh học trong chọn lựa phần mềm phù hợp 20 2.1.2. Đào tạo và chuyển giao Công nghệTin sinh học tại Việt Nam 21 2.2. ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU ĐẶC ĐIỂM GENOTYP CHỦNG VIRÚT SỞI VÀ RUBELLA LƯU HÀNH TẠI CÁC VÙNG ĐỊA LÝ DÂN CƯ 22 2.2.1. Phương pháp Sinh học phân tử ứng dụng trong phân tích genotyp chủng virút sởi và Rubella 22 2.2.1.1. Vật liệu 22 2.2.1.2. Gây nhiễm chủng virút trên nuôi cấy tếbào 23 2.2.1.3. Tách chiết ARN virút 23 2.2.1.4. Phương pháp nhân gen bằng RT-PCR và Nested PCR 24 2.2.1.5. Phương pháp RFLP 25 2.2.1.6. Phương pháp multiplex realtime PCR 25 2.2.1.7. Phương pháp xác định trình tựnucleotit 27 2.2.2. Phân tích genotyp chủng virút sởi và Rubella bằng phần mềm Tin sinh học BioNumerics 28 2.2.2.1. Phân tích genotyp chủng virút bằng phần mềm “BioNumerics sequence” 28 2.2.2.2 Phân tích genotyp chủng virút bằng phần mềm “BioNumerics fingerprint” 28 2.2.2.3. Dựng cây phảhệphát sinh loài bằng phần mềm “BioNumerics Tree and Netword Inference” 29 Chương 3. KẾT QUẢVÀ BÀN LUẬN 31 3.1. HỢP TÁC NGHIÊN CỨU VÀ CHUYỂN GIAO CÔNG NGHỆTIN SINH HỌC ỨNG DỤNG TRONG DỊCH TỄHỌC PHÂN TỬ 31 3.1.1. Kết quảnghiên cứu và chuyển giao Công nghệTin sinh học 31 3.1.2. Kết quảso sánh và chọn lựa các chương trình Tin sinh học phù hợp 31 3.2. KẾT QUẢ ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU ĐẶC ĐIỂM GENOTYP CHỦNG VIRÚT SỞI VÀ RUBELLA LƯU HÀNH TẠI CÁC VÙNG ĐịA LÝ DÂN CƯKHÁC NHAU 34 3.2.1. Giải trình tựnucleotit đoạn gen quan trọng của virút sởi 34 3.2.1.1. Tách chiết ARN virút sởi 34 3.2.1.2. Kết quảRT-PCR và Nested PCR nhân đoạn gen Nucleocapsit N virút sởi 35 3.2.1.3. Kết quảgiải trình tự đoạn ADN đặc hiệu nucleoprotein N virút sởi 37 3.2.1.4. Kết quảRFLP phân tích tính đa dạng đoạn ADN gen N virút sởi 40 3.2.2. Giải trình tựnucleotit đoạn gen glycoprotein E1 virút Rubella 43 3.2.2.1. Tách chiết ARN virút Rubella 43 3.2.2.2. Kết quảRT-PCR khuếch đại ADN gen E1 virút Rubella 43 3.2.2.3. Giải trình tựnucleotit gen E1 virút Rubella 45 3.2.3. Kết quảmultiplex realtime PCR xác định virút sởi và Rubella 47 3.2.3.1. Kết quảmutliplex PCR 47 3.2.3.2. Kết quảmutliplex realtime PCR 49 3.2.4. Ứng dụng phần mềm BioNumerics trong xác định genotyp chủng virút sởi & Rubella 52 3.2.4.1. Kết quảchọn lựa chương trình phần mềm Tin sinh học phù hợp 52 3.2.4.2. Kết quả ứng dụng phần mềm BioNumerics trong phân tích genotyp virút sởi và Rubella 54 3.2.4.3. Bản đồ dịch tễ phân bốcác genotyp virút sởi và Rubella 60 3.2.5. Đánh giá hiệu quả về khoa học công nghệ 62 Chương 4. KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 66 PHỤLỤC 70

BỘ KHOA HỌC VÀ CÔNG NGHỆ - BỘ Y TẾ VIỆN VỆ SINH DỊCH TỄ TRUNG ƯƠNG -***** - BÁO CÁO TỔNG HỢP NHIỆM VỤ HỢP TÁC QUỐC TẾ KHOA HỌC VÀ CÔNG NGHỆ THEO NGHỊ ĐỊNH THƯ TÊN NHIỆM VỤ HỢP TÁC NGHIÊN CỨU ỨNG DỤNG TIN SINH HỌC TRONG PHÁT TRIỂN DỊCH TỄ HỌC PHÂN TỬ MỘT SỐ VIRÚT GÂY BỆNH Ở NGƯỜI Cơ quan chủ trì: VIỆN VỆ SINH DỊCH TỄ TRUNG ƯƠNG Chủ nhiệm nhiệm vụ: TS LÊ THỊ KIM TUYẾN 8185 HÀ NỘI - 2010 BỘ KHOA HỌC VÀ CÔNG NGHỆ - BỘ Y TẾ VIỆN VỆ SINH DỊCH TỄ TRUNG ƯƠNG -***** - SẢN PHẨM KHOA HỌC VÀ CÔNG NGHỆ NHIỆM VỤ HỢP TÁC QUỐC TẾ KHOA HỌC VÀ CÔNG NGHỆ THEO NGHỊ ĐỊNH THƯ Tên nhiệm vụ HỢP TÁC NGHIÊN CỨU ỨNG DỤNG TIN SINH HỌC TRONG PHÁT TRIỂN DỊCH TỄ HỌC PHÂN TỬ MỘT SỐ VIRÚT GÂY BỆNH Ở NGƯỜI Cơ quan chủ trì: VIỆN VỆ SINH DỊCH TỄ TRUNG ƯƠNG Chủ nhiệm nhiệm vụ: TS LÊ THỊ KIM TUYẾN HÀ NỘI – 2010 MỤC LỤC MỞ ĐẦU Chương TỔNG QUAN 1.1 CÔNG NGHỆ TIN SINH HỌC 1.1.1 Khái niệm Tin sinh học 1.1.2 Lĩnh vực nghiên cứu tin sinh học 1.1.2.1 Phân tích trình tự 1.1.2.2 Tìm kiếm gen 1.1.2.3 Dị tìm đột biến 1.1.2.4 So sánh trình tự 1.1.2.5 Bảo tồn đa dạng sinh học 1.1.3 Công cụ phần mềm Tin sinh học 1.1.3.1 Phần mềm Tin sinh học miễn phí 1.1.3.2 Phần mềm Tin sinh học thương mại 1.1.3.3 Phần mềm Tin sinh học quyền BioNumerics 1.2 ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU DỊCH TỄ HỌC PHÂN TỬ BỆNH Ở NGƯỜI 1.2.1 Khái niệm Dịch tễ học phân tử 1.2.2 Dịch tễ học phân tử bệnh sởi 11 1.2.2.1 Virút sởi 11 1.2.2.2 Nghiên cứu dịch tễ học phân tử bệnh sởi 11 1.2.3 Dịch tễ học phân tử bệnh Rubella 14 1.2.3.1 Virút Rubella 14 1.2.3.2 Nghiên cứu dịch tễ học phân tử bệnh Rubella 15 1.2.4 Ứng dụng Tin sinh học nghiên cứu Dịch tễ học phân tử 16 Chương - PHƯƠNG PHÁP NGHIÊN CỨU 19 2.1 CHUYỂN GIAO CÔNG NGHỆ TIN SINH HỌC ỨNG DỤNG TRONG NGHIÊN CỨU 19 DỊCH TỄ HỌC PHÂN TỬ VIRÚT GÂY BỆNH Ở NGƯỜI 2.1.1 Đào tạo chuyển giao Công nghệ Tin sinh học Pháp 19 2.1.1.1 Đào tạo kiến thức Công nghệ Tin sinh học 19 2.1.1.2 Chuyển giao Công nghệ Tin sinh học chọn lựa phần mềm phù hợp 20 2.1.2 Đào tạo chuyển giao Công nghệ Tin sinh học Việt Nam 21 2.2 ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU ĐẶC ĐIỂM GENOTYP CHỦNG 22 VIRÚT SỞI VÀ RUBELLA LƯU HÀNH TẠI CÁC VÙNG ĐỊA LÝ DÂN CƯ 2.2.1 Phương pháp Sinh học phân tử ứng dụng phân tích genotyp chủng 22 virút sởi Rubella 2.2.1.1 Vật liệu 22 2.2.1.2 Gây nhiễm chủng virút nuôi cấy tế bào 23 2.2.1.3 Tách chiết ARN virút 23 2.2.1.4 Phương pháp nhân gen RT-PCR Nested PCR 24 2.2.1.5 Phương pháp RFLP 25 2.2.1.6 Phương pháp multiplex realtime PCR 25 2.2.1.7 Phương pháp xác định trình tự nucleotit 27 2.2.2 Phân tích genotyp chủng virút sởi Rubella phần mềm Tin sinh học 28 BioNumerics 2.2.2.1 Phân tích genotyp chủng virút phần mềm “BioNumerics sequence” 28 2.2.2.2 Phân tích genotyp chủng virút phần mềm “BioNumerics fingerprint” 28 2.2.2.3 Dựng phả hệ phát sinh loài phần mềm “BioNumerics Tree and 29 Netword Inference” Chương KẾT QUẢ VÀ BÀN LUẬN 31 3.1 HỢP TÁC NGHIÊN CỨU VÀ CHUYỂN GIAO CÔNG NGHỆ TIN SINH HỌC ỨNG 31 DỤNG TRONG DỊCH TỄ HỌC PHÂN TỬ 3.1.1 Kết nghiên cứu chuyển giao Công nghệ Tin sinh học 31 3.1.2 Kết so sánh chọn lựa chương trình Tin sinh học phù hợp 31 3.2 KẾT QUẢ ỨNG DỤNG TIN SINH HỌC TRONG NGHIÊN CỨU ĐẶC ĐIỂM 34 GENOTYP CHỦNG VIRÚT SỞI VÀ RUBELLA LƯU HÀNH TẠI CÁC VÙNG ĐịA LÝ DÂN CƯ KHÁC NHAU 3.2.1 Giải trình tự nucleotit đoạn gen quan trọng virút sởi 3.2.1.1 Tách chiết ARN virút sởi 34 34 3.2.1.2 Kết RT-PCR Nested PCR nhân đoạn gen Nucleocapsit N virút sởi 35 3.2.1.3 Kết giải trình tự đoạn ADN đặc hiệu nucleoprotein N virút sởi 37 3.2.1.4 Kết RFLP phân tích tính đa dạng đoạn ADN gen N virút sởi 40 3.2.2 Giải trình tự nucleotit đoạn gen glycoprotein E1 virút Rubella 43 3.2.2.1 Tách chiết ARN virút Rubella 43 3.2.2.2 Kết RT-PCR khuếch đại ADN gen E1 virút Rubella 43 3.2.2.3 Giải trình tự nucleotit gen E1 virút Rubella 45 3.2.3 Kết multiplex realtime PCR xác định virút sởi Rubella 47 3.2.3.1 Kết mutliplex PCR 47 3.2.3.2 Kết mutliplex realtime PCR 49 3.2.4 Ứng dụng phần mềm BioNumerics xác định genotyp chủng virút sởi & Rubella 52 3.2.4.1 Kết chọn lựa chương trình phần mềm Tin sinh học phù hợp 52 3.2.4.2 Kết ứng dụng phần mềm BioNumerics phân tích genotyp virút 54 sởi Rubella 3.2.4.3 Bản đồ dịch tễ phân bố genotyp virút sởi Rubella 60 3.2.5 Đánh giá hiệu khoa học công nghệ 62 Chương KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 66 PHỤ LỤC 70 MỞ ĐẦU Trong vài thập kỷ qua, Sinh học phân tử đánh giá ngành khoa học với bước phát triển mạnh mẽ Hàng loạt cơng cụ ứng dụng sinh học đời góp phần thúc đẩy q trình phân tích giải mã liệu thông tin thu từ nghiên cứu sinh học mức độ phân tử ADN Có thể nói chưa thơng tin sinh học trở nên phong phú đa dạng Để giải mã khối luợng thông tin đồ sộ vậy, Công nghệ thông tin ứng dụng vào Sinh học cách triệt để Tin sinh học đời, kết hợp khoa học Cơng nghệ thông tin thành tựu nghiên cứu sinh học mức độ phân tử ADN Những thành tựu Tin sinh học hỗ trợ mạnh mẽ việc đưa Sinh học, Y học vào giải cơng việc thực tiễn, thúc đẩy nhanh q trình chẩn đốn bệnh, tìm y dược phẩm mới, vắcxin phịng dịch, kít chẩn đốn Tin sinh học cịn cơng cụ hữu ích việc xử lý liệu thơng tin trình tự ADN gen, lập đồ phát sinh phân bố genotyp loài vi sinh lưu hành theo vùng địa lý theo thời gian Điều cần thiết nghiên cứu giám sát dịch tễ học phân tử nhằm ngăn chặn dịch bệnh nguy hiểm người Lĩnh vực Tin sinh học vô phát triển Thế giới Việc đưa Tin học vào Sinh học quan tâm hầu phát triển Trong khu vực Châu Á, nước Trung Quốc, Hàn Quốc, Nhật Bản có đột phá lĩnh vực Đối với Việt Nam, Tin sinh học ngành khoa học non trẻ xuất Viện nghiên cứu vài trường Đại học lớn dừng lại giới nghiên cứu Cơng nghệ sinh học Điều thiết yếu cần có Tin sinh học ngân hàng liệu cho phép người dễ dàng truy cập thông tin Thứ hai cần có phần mềm tin học làm cơng cụ để phân tích liệu ngân hàng sinh học Tuy nhiên, nước ta, việc tạo sản phẩm phần mềm để đưa vào áp dụng vô hoi Đội ngũ người làm Tin sinh học cịn hạn hẹp Để có ngân hàng liệu đặc hiệu cho hoàn cảnh Việt Nam, cần có mơi trường nghiên cứu phát triển thuận lợi nhằm tạo nhu cầu cho Tin sinh học Việc đào tạo đội ngũ chuyên gia Tin sinh học điều định cho thành công việc phát triển Tin sinh học Đội ngũ địi hỏi khơng nắm bắt trình độ tư tốn học Tin học mà cịn phải thơng hiểu vấn đề Sinh học Việc đào tạo kỹ nghiên cứu độc lập khả cộng tác với đồng nghiệp Thế giới đội ngũ khoa học điều kiện thiết yếu trình phát triển Tin sinh học Việt Nam Xuất phát từ đòi hỏi cấp bách thực tiễn ngành Tin sinh học Việt Nam, với định hướng phát triển ứng dụng công nghệ Tin sinh học nghiên cứu dịch tễ học phân tử, nhiệm vụ hợp tác quốc tế Viện Vệ sinh Dịch tễ TƯ Viện Pasteur Paris, Pháp “Hợp tác nghiên cứu ứng dụng Tin sinh học dịch tễ học phân tử số virút gây bệnh nguy hiểm người” triển khai nhằm đạt hai mục tiêu chính: Hợp tác nghiên cứu chuyển giao công nghệ Tin sinh học (Bioinformatic) ứng dụng Dịch tễ học phân tử số virút gây bệnh người Ứng dụng Tin sinh học nghiên cứu đặc điểm genotyp số chủng virút (Rubella, sởi) lưu hành vùng địa lý dân cư khác Việc xây dựng ứng dụng Tin sinh học hỗ trợ nghiên cứu chuyển giao công nghệ Tin sinh học vơ cần thiết, qua giúp nhanh chóng hồ nhập với cộng đồng ngồi nước, mở hội hợp tác nghiên cứu khoa học với nước khu vực giới Hơn thế, việc ứng dụng rộng rãi thành công Tin sinh học nhiều lĩnh vực Sinh học đóng góp phần thiết yếu việc thúc đẩy phát triển Sinh học Quốc gia Chương TỔNG QUAN 1.1 CÔNG NGHỆ TIN SINH HỌC 1.1.1 Khái niệm Tin sinh học Tin sinh học (Bioinformatic) kết hợp Cơng nghệ thơng tin nghiên cứu Sinh học mức độ phân tử ADN Thuật ngữ Tin sinh học đặt Paulien Hogeweg vào năm 1978 khởi nguồn từ việc nghiên cứu trình tin học hệ thống kháng sinh Nói rộng hơn, Tin sinh học cịn biết đến lĩnh vực khoa học sử dụng ngành toán học ứng dụng, tin học thống kê, khoa học máy tính, trí tuệ nhân tạo, hố học hoá sinh để giải vấn đề sinh học Một thuật ngữ thường dùng cho Tin sinh học Sinh học tính tốn (computational biology) Tuy nhiên Tin sinh học thiên việc phát triển giải thuật, lý thuyết kỹ thuật thống kê tính tốn để giải tốn bắt nguồn từ nhu cầu quản lý phân tích liệu sinh học Trong Sinh học tính tốn thiên kiểm định giả thuyết (hypothesis) đặt vấn đề sinh học nhờ máy tính thực nghiệm liệu mơ phỏng, với mục đích phát nâng cao trí thức sinh học Thuật ngữ Tin sinh học Sinh học tính tốn thường dùng để hốn đổi cho nhau, trước, nói cách nghiêm túc, tập sau Những mối quan tâm dự án Tin sinh học Sinh học tính tốn việc sử dụng cơng cụ tốn học để trích rút thơng tin hữu ích từ liệu hỗn độn thu thập từ kỹ thuật sinh học với lưu lượng mức độ lớn [3], [4] Tin sinh học ngày đòi hỏi sáng tạo tiến sở liệu, thuật tốn, kỹ thuật tính tốn thống kê lý thuyết để giải vấn để thực tế phát sinh từ việc quản lý phân tích liệu sinh học Trong thập kỷ qua, với kết hợp phát triển nhanh chóng nghiên cứu công nghệ gen nghiên cứu phân tử với phát triển công nghệ thông tin tạo số lượng liệu khổng lồ thông tin liên quan đến sinh học phân tử Có thể nói, “Tin sinh học tên đặt cho ứng dụng tốn học vi tính để làm sáng tỏ hiểu biết trình sinh học” Các hoạt động thường gặp tin sinh học gồm lập đồ phát sinh lồi, phân tích ADN chuỗi protein, kéo dài ADN chuỗi protein khác để so sánh chúng tạo xem mơ hình 3-D cấu trúc protein [3], [31] 1.1.2 Lĩnh vực nghiên cứu Tin sinh học Thực chất Tin sinh học gắn liền với nhiều ngành khoa học khác nhau, nghiên cứu nhiều lĩnh vực khác nhau, nhằm thu thập, lưu trữ phân tích liệu sinh học Kết nghiên cứu tạo phần mềm giúp giải số vấn đề xung quanh việc tìm hiểu gen, protein số vấn đề khác liên quan đến Sinh học phân tử 1.1.2.1 Phân tích trình tự Kể từ gen Phage Φ-X174 xác định trình tự (1977) nay, trình tự ADN nhiều lồi sinh vật lưu trữ ngân hàng sở liệu gen Việc so sánh gen lồi hay lồi khác cho thấy tương đồng chức protein, hay mối quan hệ phát sinh chủng loài loài thể phát sinh chủng loài (phylogenetic tree) Với tăng trưởng khổng lồ liệu loại này, việc phân tích trình tự ADN cách thủ công trở nên thực Ngày nay, chương trình máy tính sử dụng để giúp tìm trình tự tương đồng đồ gen hàng loạt sinh vật, với số lượng nucleotit trình tự lên đến hàng tỷ Những chương trình tìm kiếm trình tự ADN khơng giống hoàn toàn đột biến nucleotit gây nên thay thế, hay thêm gốc bazơ Thuật ngữ bắt cặp trình tự (sequence alignment) áp dụng trình xác định trình tự ADN, kỹ thuật xác định trình tự đoạn nhỏ (shotgun sequencing) Kỹ thuật công ty Celera Genomics sử dụng để xác định trình tự genom vi khuẩn Haemophilus influenza Kỹ thuật xác định trình tự tiến hành với đoạn ADN lớn cỡ vài chục nghìn nucleotit trở lên nên cần phải xác định trình tự nhỏ để giải mã hàng nghìn đoạn trình tự với kích thước khoảng 600-800 nucleotit Sau đó, đoạn trình tự nhỏ xếp thứ tự nối lại với thông qua việc bắt cặp trình tự đầu gối lên (overlap) tạo thành trình tự genom hồn chỉnh Xác định trình tự đoạn nhỏ kỹ thuật ưu tiên sử dụng hầu hết nghiên cứu giải mã genom giải thuật lắp ráp genom (genome assembly algorithms) lĩnh vực nóng tin sinh học [2],[3] Hiện nay, nhiều phịng thí nghiệm Viện nghiên cứu đầu ngành VN triển khai kỹ thuật lắp ráp genom việc xác định trình tự nucleotit hồn chỉnh genom virút (cúm H5N1, SARS) bước đầu thành cơng [9], [14] 1.1.2.2 Tìm kiếm gen Trong nghiên cứu đồ gen (genomics), thuật ngữ annotation q trình đánh dấu gen đặc tính sinh học khác chuỗi ADN Không phải tất nucleotit bên genom gen Phần lớn ADN bên genom sinh vật bậc cao đoạn ADN không phục vụ cho nhiệm vụ cụ thể gọi đoạn ADN rác Tin sinh học giúp cho việc tìm kiếm tự động gen trình tự điều khiển bên genom Hệ thống phần mềm làm nhiệm vụ “genome annotation” thiết kế vào năm 1995 Owen White cho giải mã vi khuẩn Haemophilus influenza Tác giả White xây dựng hệ thống phần mềm để tìm kiếm gen nằm chuỗi ADN làm nhiệm vụ mã hoá protein, ARNt vận chuyển chức khác tạo nên chức gen Hiện nay, hầu hết hệ thống genome annotation hoạt động tương tự chương trình nhằm để phân tích lĩnh vực nghiên cứu đồ gen ADN thường xuyên cải tiến [3] 1.1.2.3 Dị tìm đột biến Rất nhiều nghiên cứu xác định trình tự (sequencing) nhằm tìm đột biến điểm (point mutation) xảy gen khác Tập liệu tạo đòi hỏi hệ thống tự động đọc liệu kiểu chuỗi (sequence data) so sánh trình tự kết với trình tự biết genom Những hệ thống oligonucleotit microarray cho phép nghiên cứu đồng thời hàng trăm ngàn vị trí tồn đồ gen sử dụng để xác định đột biến thêm đoạn nhiễm sắc thể Mơ hình chuỗi Markov ẩn (Hidden Markov Model) phương pháp QUY TRÌNH ỨNG DỤNG TIN SINH HỌC TRONG PHÂN TÍCH GENOTYP VIRÚT SỞI VÀ RUBELLA Chương trình phần mềm đóng vai trị thiết yếu Tin sinh học Hàng trăm phần mềm lập trình giúp cho việc lưu trữ, chọn lựa, so sánh xử lý thơng tin trình tự ADN Nhiều phần mềm sử dụng rộng rãi nghiên cứu phân tích trình tự gen FASTA, BLAST, Mega 4, ClustalW, Phylip, Peptool, Genetool, BioEdit, SeqVISTA, Primer3, T-coffee, PC-Genes, DNASIS… BioNumerics phần mềm tin học quyền Hãng Applied Maths (Bỉ) Tính trổi BioNumerics dễ dàng tạo lượng lớn liệu từ kỹ thuật thử nghiệm khác nhau, hỗ trợ cho việc phân tích kết thử nghiệm Các sở liệu nhập dựa liệu sinh học từ gel điện di RFLP phổ sắc ký giải trình tự Các kết thu nhận từ thực nghiệm kỹ thuật Sinh học phân tử (RFLP giải trình tự) tạo nguồn sở liệu cho thực việc chọn lựa ứng dụng phần mềm BioNumerics nghiên cứu dịch tễ học phân tử, xác định phân bố genotyp chủng vi sinh gây bệnh mơ hình chủng virút sởi Rubella Phần mềm BioNumerics cơng cụ hữu ích việc xử lý liệu thơng tin trình tự ADN gen, lập phả hệ phát sinh loài đồ dịch tễ phân bố genotyp loài vi sinh lưu hành theo thời gian vùng địa lý Quy trình ứng dụng phần mềm BioNumerics xây dựng phù hợp với điều kiện kỹ đội ngũ cán Việt Nam QUY TRÌNH ỨNG DỤNG TIN SINH HỌC TRONG PHÂN TÍCH GENOTYP VIRÚT SỞI VÀ RUBELLA Quy trình ứng dụng phần mềm “BioNumerics Sequence Types” 1.1 Tạo thư mục chủ: 1.1.1 Khởi động phần mềm BioNumerics 1.1.2 Trong chương trình BioNumerics Starup, ấn biểu tượng để vào New database winzard 1.1.3 Nhập tên cho sở liệu, ví dụ: Rubella ấn để vào bước thứ hai New database winzard 1.1.4 Trong bước thứ hai New database winzard Chọn để tự động tạo thư mục theo yêu cầu ấn để vào bước thứ ba New database winzard 1.1.5 Trên hình hiển thị “Whether or not you want to create log file” Ấn để tạo tập tin khoá (log files) ấn 1.5.6 Chọn kiểu sở liệu theo yêu cầu hộp thoại Setup new database Ví dụ New connected database Local database Ấn để bắt đầu công việc với sở liệu vừa tạo 1.2 Xác định kiểu trình tự mới: Trong BioNumerics main window, chọn Experiments > Create new sequence type từ bảng chọn công cụ, ấn Experiments panel phía bên phải hình, chọn New sequence type 1.2.1 Cửa sổ New sequence type nhắc việc nhập tên cho dạng (new type) Nhập tên, ví dụ "Rubella VN" (Hình 1.2.1) Ấn 1.2.2 Chọn kiểu trình tự: Nucleic acid sequence Amino acid sequence Ví dụ: chọn Nucleic acid sequence (Hình 1.2.2) 1.2.3 Ấn để hoàn thành việc thiết lập dạng trình tự Kiểu trình tự “Rubella VN” liệt kê Experiment panel Hình 1.2.1 New sequence type wizard Hình 1.2.2 New sequence type wizard 1.3 Nhập liệu trình tự Dữ liệu trình tự gồm nucleic amino axit Phần mềm BioNumerics bao gồm công cụ nhập cho định dạng EMBL, GenBank, FASTA Với chương trình dịch hợp ngữ (Asembler program) BioNumerics, trình tự tiếp giáp từ phần trình tự lắp ráp Asembler chấp nhận tập tin kí tự phẳng chromatogram (ABI, Beckman, Amersham) 1.3.1 Nhập liệu từ trình tự Fasta 1.3.1.1 Nếu chưa cài đặt Import plugin, Ấn vào File>Install/Remove plugin để mở cửa sổ Plugin Installation (Những chương trình nhỏ dạng khả thi exe hay dạng file dll) 1.3.1.2 Chọn Import ấn Install để kiểm tra cài đặt (Kí hiệu ‘x’ màu đỏ chuyển sang kí hiệu ‘v’ màu xanh) Đóng cửa sổ Plugin Installation 1.3.1.3 Chọn kiểu thí nghiệm Rubella VN 1.3.1.4 Chọn File > Import > Import FASTA sequence từ danh mục sở liệu cơng cụ 1.3.1.5 Tìm chọn tập tin Rubella-seq.txt hộp thoại Open file Ấn Import 1.3.1.6 Trong cửa sổ liệu, ấn để kiểm tra trình tự nhập database entry 1.3.2 Nhập liệu trình tự dạng Chromatogram Asembler chương trình dịch hợp ngữ, cho phép lắp ráp trình tự tiếp giáp từ phần trình tự sau giải trình tự (sequencing experiments) Asembler chấp nhận tập tin chromatogram từ máy giải trình tự tự động ABI, Beckman, Amersham (ví dụ: Tập tin Chromatogram virút Rubella thu nhận từ Beckman) 1.3.2.1 Vào Database > Add new entry, chọn công cụ Đặt tên cho entry mới, cửa sổ thư mục chủ hiển thị tên entry 1.3.2.2 Ấn đúp chuột vào mục sở liệu mà chưa có trình tự Cửa sổ Entry Edit window xuất 1.3.2.3 Ấn để vào dạng trình tự Ví dụ: Rubella VN 1.3.2.4 Màn hình hiển thị “ The experiment “Rubella VN” is not defined for this entry Do you want to create a new one?” 1.3.2.5 Ấn , chương trình tạo trình tự trống kết nối với mục sở liệu Khi làm việc với Local database, Experiment card mở Ấn để đưa Assembler program Khi làm việc với sở liệu kết nối (Connected database), Sequence viewer mở, ấn công cụ để đưa Assembler program 1.3.2.6 Ấn Experiment card Sequence viewer để đưa Assembler program Cửa sổ Assembler window trống xuất 1.3.2.7 Chọn File > Import sequence files ấn Các định dạng: AB, SCF, MegaBACE Flat text nhập File of type (Hình 1.3.2.7) Hình 1.3.2 Cửa sổ Assemble window 1.3.2.8 Ấn vào biểu tượng công cụ chọn File > Assembler sequence 1.3.2.9 Chọn “Consensus trimming” ấn để mở hộp thoại Consensus trimming (Hình 1.3.2.8) Hình 1.3.2.8 Hộp thoại Consensus trimming Trong Trimming targets, điền vào Start pattern, Stop pattern, Mismatches, allowed, Taget range Ví dụ: Start pattern: CCAGTAG Start position offset: Stop pattern: CGGGTC Stop position offset: 1.3.2.9 Sau lưu lại cách chọn ấn Kết lưu lại hiển thị thư mục chủ BioNumerics 1.3.3 Nhập trình tự ADN từ sở liệu 1.3.3.1 Nhập trình tự ADN sở liệu kết nối (Connected database) 1.3.3.1.1 Vào Database > Add new entry, chọn công cụ Đặt tên cho entry mới, cửa sổ thư mục chủ hiển thị tên entry 1.3.3.1.2 Ấn vào tên entry thư mục chủ, cửa sổ Entry Edit lên 1.3.3.1.3 Ấn vào hình cửa sổ Entry Edit để nạp liệu 1.3.3.1.4 Cửa sổ Sequence Viewer 1.3.3.1.5 Sao chép liệu từ clipboard vào cửa sổ Sequence Viewer (Hình 1.3.2.1.5) Ấn để lưu lại Hình 1.3.2.1.5 Cửa sổ Sequence Viewer 1.3.3.2 Nhập trình tự ADN Local database 1.3.3.2.1 Chọn kiểu liệu trình tự Rubella VN tạo 1.3.3.2.2 Ấn chuột phải vào File panel chọn Add new experiment file từ bảng chọn di động (Chú ý: Tính chấp nhận làm việc local database) 1.3.3.2 Nhập tên, ví dụ: “Seq01” ấn 1.3.3.2.4 Chọn Seq01 Files panel, File > Open experiment file (data) Điều mở cửa sổ Sequence data file, mà ban đầu trống rống Trước nhập trình tự, phải nhập mục vào tập tin Giả sử muốn nhập liệu trình tự cho ba mục sở liệu 1.3.3.2.5 Chọn Entries > Add new entries ấn 1.3.3.2.6 Chương trình nhắc nhở việc nhập số mục; nhập ấn 1.3.3.2.7 Sao chép trình tự từ bảng ghi tạm nhớ máy tính (clipboard) chọn Sequence > Paste from clipboard để dán nội dung clipboard vào trình tự chọn lựa 1.3.3.2.8 Ấn chuột đúp chọn Sequence > Edit để chỉnh sửa tay trình tự thêm bazơ 1.3.3.2.9 Chọn File > Exit kết thúc cơng việc chỉnh sửa trình tự Quy trình ứng dụng phần mềm “BioNumerics Fingerprint Types” 2.1 Tạo thư mục chủ: Vào cửa sổ bắt đầu chương trình BioNumerics, ấn Creat new database để tạo thư mục chủ Đặt tên cho thư mục chủ Ví dụ: Fingerprint MR 2.2 Chọn kiểu liệu Fingerprint thư mục chủ: Vào BioNumerics main window, chọn Experiments > Create new fingerprint Experiments panel toolbar chọn type từ bảng chọn, ấn vào nút New fingerprint type 2.2.1 Cửa sổ New fingerprint type nhắc việc nhập tên cho dạng (new type) Nhập tên, ví dụ "RFLP" ấn 2.2.2 Chọn Two-dismensional TIFF files bit (256 values), ấn tiếp (Hình 2.2.2) Hình.2.2.2 New Fingerprint type winzard Hình 2.2.3 New Fingerprint type winzard 2.2.3 Trong bước tiếp theo, hình hiển thị: Do your fingerprints have inverted densitometric values? (Hình 2.2.3) Chọn Yes để đồng ý đảo chiều từ gel gốc đen băng trắng sang trắng băng đen ấn 2.2.4 Chọn Yes để đồng ý Background subtration ấn để hoàn thành bước tạo new fingerprint type Trong cửa sổ Experiments panel, tập tin RFLP nạp vào danh mục liệu fingerprint type 2.3 Nhập liệu Fingerprint vào kiểu liệu chọn thư mục chủ 2.3.1 Ấn nút Files panel chọn File > Add new experiment file BioNumerics main window 2.3.2 Chọn tập tin ảnh có TIFF từ thư mục chung, từ đĩa từ website Ví dụ: chọn tập tin Gel_01.tif (Hình 2.3.2) 2.3.3 Màn hình hiển thị: “Do you want to edit the image before adding it to the database?” Ấn vào để mở Image import window 2.3.4 Trong Fingerprint Image import window chọn Image > Convert to gray scale > Averaged 2.3.5 Tiếp theo, Fingerprint Image import window chọn File > Add image to database Đóng cửa sổ Fingerprint image import, trở lại cửa sổ thư mục chủ 2.4 Xử lí gel 2.4.1 Nhấn chuột phải vào tập tin (ví dụ: Gel_01) nhập Files panel chọn Open experiment file (data) 2.4.2 Cửa sổ Fingerprint data of (Gel_01) lên Chọn vùng mẫu phân tích gel (Hình 2.4.2) Hình 2.4.2 Tập tin Gel_01 Hình 2.3.2 Tập tin Gel_01.tif 2.4.3 Chọn Lanes > Auto search lanes ấn để chương trình tự động tìm kiếm đường băng ADN Nhập tổng số đường băng ADN tương ứng có gel vào hộp hội thoại Search lanes Ví dụ: 18 2.4.4 Sử dụng chuột máy tính giữ phím Shirt để chỉnh đường băng (Hình 2.3.9) Tiếp theo ấn Hình 2.3.9 Chỉnh sửa đường băng ADN 10 2.4.5 Ấn Edit để chỉnh độ dãn đường băng, cửa sổ Fingerprint conversion settings lên, chọn phần Densitometric curves, nhập số đơn vị khoảng cách dãn vào phần Averaging thickness Ấn 2.4.6 Chọn để đánh dấu đường băng thang ADN chuẩn cách ấn chuột vào vị trí thang (Hình 2.4.6) Hình 2.4.6 Đánh dấu đường băng thang ADN chuẩn 2.4.7 Ấn chuột phải vào vị trí băng ADN thang chuẩn chọn Add a new external reference position để nhập kích thước băng ADN.(Hình 2.4.7) Sau nhập đủ kích thước tương ứng băng ADN chuẩn, ấn Hình 2.4.7 Nhập kích thước băng thang ADN chuẩn 11 2.4.8 Vào Bands > Auto search bands ấn nút để chương trình tự động tìm kiếm vị trí băng ADN mẫu phân tích Cửa sổ Band search lên, chọn Search on all lanes 2.4.9 Dựa vào phần Densitometric curves phía bên phải cửa sổ Fingerprint data of (Gel_01) để chỉnh sửa nâng cao chất lượng hình ảnh Điều chỉnh ảnh nền, làm mịn đường cong loại bỏ băng nhiễu cách nhấn chuột phải vào vị trí băng này, chọn Delete select band(s), chương trình tự động xử lí 2.4.10 Khơi phục lại băng xoá nhầm cách nhấn chuột phải vào vị trí chọn Add a new band 2.4.11 Sau ấn để lưu chỉnh sửa Các liệu Fingerprint sau xử lí nhập vào thư mục chủ chương trình 2.5 Nạp đường gel vào sở liệu 2.5.1 Chọn vào Database > Add new entry chọn công cụ 2.5.2 Nhập tên mục cần tạo Ví dụ: 1,2 ấn Phần mềm nhập tự động mục liệu với từ khoá 2.5.3 Lựa chọn tập tin gel File panel File > Open experiment file công cụ File panel (entries) bảng chọn ấn Cửa sổ Fingerprint file ‘Gel_01’ mở liệt kê đường băng ADN xác định (Hình 2.5.3) 12 Hình 2.5.3 Cửa sổ Fingerprint entry file 2.5.4 Biểu tượng mũi tên liên kết cho đường gel liên kết đường gel vào sở liệu cách di chuột Khi thử nghiệm liên kết, biểu tượng mũi tên chuyển sang màu tím 2.5.5 Kéo mũi tên liên kết đường (đường tham khảo) vào mục sở liệu mới: sau xong mục sở liệu, hình dạng trỏ thay đổi thành 2.5.6 Thả chuột từ mục sở liệu tạo trên; mơ hình liên kết với mục sở liệu mũi tên liên kết cửa sổ Fingerprint entry file trở thành màu tím thay màu xám Các đường gel nạp vào mục sở liệu thư chủ Quy trình ứng dụng phần mềm “BioNumerics Tree and Netword Inference” Chức Phần mềm “BioNumerics Tree and Netword Inference” phân tích sở liệu chọn lựa Trung tâm chức phân tích cửa sổ “Comparison window” Cửa sổ hiển thị cách tổng quan toàn diện tất thí nghiệm, cho phép lựa chọn so sánh liệu thí nghiệm với liệu khác Với chức này, “Comparison window” cho phép tính tốn hiển 13 thị phân tích cặp nhóm (cluster analysis) gióng cột thẳng hàng trình tự ADN (alignment of sequence) 3.1 Vẽ phả hệ phân loại genotyp dựa trình tự ADN 3.1.1 Vào BioNumerics, chọn thư mục chủ nạp trình tự ADN lựa chọn Ví dụ: ADN Rubella 3.1.2 Chọn lựa liệu trình tự ADN nhập thư mục chủ cách đồng thời ấn Ctrl ấn trỏ chuột vào phía trước trình tự ADN chọn lựa, mũi tên trước trình tự 3.1.3 Chọn Comparisons > Create new comparison (ALT+C) ấn nút từ công cụ Comparison panel Cửa sổ Comparisons window tạo với sở liệu chọn lựa 3.1.4 Tính tốn ma trận cặp nhóm tương tự cách chọn Clustering> Calculate > Cluster analysis ấn chọn 3.1.5 Giữ lại cài đặt mặc định ấn để tính tốn ma trận hình ảnh phả hệ (dendrogram) Hình 3.1.5 Phân tích cặp nhóm trình tự (Pairwise sequence cluster analysis) 14 Các ma trận tương tự xuất bảng Similarities Các dendrogram xuất bảng Dendrogram Đến lúc trình tự chưa xếp chưa tính tốn gióng cột thẳng hàng (multiple alignment) (Hình 3.1.5) 3.1.6 Chọn Sequence > Multiple sequence alignment ấn Giữ lại cài đặt mặc định ấn để bắt đầu multiple alignment 3.1.7 Chọn File > Print preview Chỉnh sửa cho cân đối, ấn Print để in 3.2 Vẽ phả hệ dựa liệu Fingerprint 3.2.1 Mở liệu DemoBase từ danh mục Starup screen BioNumerics ấn nút 3.2.2 Chọn lựa liệu Fingerprint nhập vào mục thư mục chủ cách đồng thời ấn Ctrl ấn trỏ chuột vào phía trước mục chọn lựa, mũi tên trước mục 3.2.3 Chọn Comparisons > Create new comparison (ALT+C) ấn nút từ công cụ Comparison panel Cửa sổ Comparisons window tạo với sở liệu chọn lựa 3.2.4 Tính tốn cặp giá trị tương đồng với hệ số tương đồng cách ấn Clustering> Calculate > Cluster analysis ấn chọn 3.2.5 Ấn để chấp nhận tất thiết lập 3.2.6 Ấn hộp thoại Comparison settings để bắt đầu phân tích nhóm Khi phân tích nhóm hoàn thành, dendrogram xuất bảng Dendrogram ma trận tương tự xuất bảng Similarities (Hình 3.2.7) 15 Hình 3.2.7 Cửa sổ Comparison Các thiết lập phân tích nhóm phía bảng Similarities 3.2.7 Ấn công cụ để hiển thị gel cửa sổ Experiment data 3.2.8 Chọn File > Print preview Chỉnh sửa cho cân đối, ấn Print để in Tài liệutham khảo BioNumerics Quick Guide Version 5.1 http://www Applied-maths.com BioNumerics Manual Version 6.0 Copyright © 1998 2009 Applied Maths NV Belgium 16 ... SINH HỌC TRONG NGHIÊN CỨU DỊCH TỄ HỌC PHÂN TỬ BỆNH Ở NGƯỜI 1.2.1 Khái niệm Dịch tễ học phân tử 1.2.2 Dịch tễ học phân tử bệnh sởi 11 1.2.2.1 Virút sởi 11 1.2.2.2 Nghiên cứu dịch tễ học phân tử bệnh. .. bệnh sởi 11 1.2.3 Dịch tễ học phân tử bệnh Rubella 14 1.2.3.1 Virút Rubella 14 1.2.3.2 Nghiên cứu dịch tễ học phân tử bệnh Rubella 15 1.2.4 Ứng dụng Tin sinh học nghiên cứu Dịch tễ học phân tử 16... ĐỊNH THƯ Tên nhiệm vụ HỢP TÁC NGHIÊN CỨU ỨNG DỤNG TIN SINH HỌC TRONG PHÁT TRIỂN DỊCH TỄ HỌC PHÂN TỬ MỘT SỐ VIRÚT GÂY BỆNH Ở NGƯỜI Cơ quan chủ trì: VIỆN VỆ SINH DỊCH TỄ TRUNG ƯƠNG Chủ nhiệm nhiệm

Ngày đăng: 12/04/2014, 12:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan