Thông tin tài liệu
3/25/2014 TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TPHCM KHOA CNSH & KTMT HỆ ĐẠI HỌC Chƣơng Giải mã trình tự tồn bộ gen ThS Nguyễn Thành Ln Email: luannt@cntp.edu.vn NỘI DUNG BÀI HỌC Khái niệm giải mã gen (genomic sequencing) Giải mã trình tự theo phương pháp Sanger: định nghĩa, bước bản, sản phẩm Phương pháp tạo phản ứng cho việc giải mã: Walking & Shotgun Ưu & nhược điểm giải mã trình tự Các hướng khắc phục: mơ hình quỹ cộng đồng & mơ hình cá nhân Hướng giải tương lai Why sequencing? 3/25/2014 Why sequencing? Bản hƣớng dẫn cho ngành sinh học Khám phá gen mã hóa gen lồi động vật Tại cần thiết phải giải mã toàn bộ gen? Phân biệt dòng giống từ khác biệt trình tự 3/25/2014 Tại cần thiết phải giải mã toàn bộ gen? Khám phá kiểu di truyền gây đột biến khác Khám phá đột biến gây bệnh di truyền Giải mã trình tự (Gene Sequencing) Có phương pháp giải mã trình tự? Phương pháp giải mã trình tự tối ưu hơn? Tại sao? Mục đích cuối giải mã trình tự tồn bộ gen gì? Các bƣớc giải mã trình tự SH Phƣơng pháp giải trình tự tồn hệ gen trải qua giai đoạn: Bắt đầu đồ di truyền tế bào NST Thực giải mã qua giai đoạn đạt mục đích cuối giải mã tồn nucleotide NST 3/25/2014 Khi sử dụng giải trình tự? 10 Phản ứng giải mã trình tự sinh học The Nobel Prize in Chemistry 1958 Frederick Sanger (1918 - 2013) Được phát minh Fred Sanger Sử dụng enzyme DNA polymerase Các phản ứng chứa “điểm đích” để tạm dừng q trình tổng hợp 11 Giải mã trình tự Sanger Hoạt động thực phản ứng nhẹ nhàng phá gãy đoạn DNA chuẩn tái tạo, xúc tác enzyme DNA polymerase 12 3/25/2014 Phản ứng giải mã trình tự 13 Các bƣớc giải mã trình tự Thêm đoạn mồi: Thêm enzyme cắt DNA polymerase: Thêm nhóm bazơ nitric (4 nitrogenous bases): Thêm nhóm dideoxynucleotide (ddNTPs) 14 Nguyên lý giãi mã Phân biệt rõ PCR giải mã trình tự PCR khuếch đại trình tự 15 3/25/2014 Sản phẩm phản ứng giải mã trình tự Phản ứng diễn 1000 lần từ sợi DNA khn Mỗi vị trí có đánh dấu nhiều lần 16 Máy giải mã trình tự gen 17 Giải mã trình tự gen Với việc sử dụng phần mềm khác nhau, cung cấp cho hình ảnh gel Mỗi vạch (band) tương ứng cho mảnh đoạn DNA khác đoạn chiều dài nucleotide Màu sắc vạch biểu thị cho việc ddNTPs kết hợp đoạn DNA 18 3/25/2014 Giải mã trình tự gen Giải mã trình tự khu vực gel để đọc kết giải mã 19 Phản ứng giải mã trình tự (primary sequencing) Không sử dụng thuốc nhuộm (dyes) & dung dịch đệm chạy mẫu (loading buffer) Các ký tự đích (terminator) đánh dấu chất phóng xạ Thực phản ứng riêng biệt, phản ứng khác với ký tự đích khác 20 Quá trình giải mã trình tự Quá chậm cho Genomics Tối đa khoảng 500 base/1 lần giải mã trình tự Mỗi base phải đọc film X-ray ghi lại nhiều lần kết cách thủ công (tay, thuê nhân công ) Tốn công sức & hiệu kinh tế 21 3/25/2014 Q trình giải mã trình tự Dự tính thời gian: Bacteriophage có 5000bp Mất năm để hoàn thành việc giải mã Các loài đơn giản (Vi khuẩn) có genome khoảng 2,000,000 bp Mất khoảng1,600 năm cho việc giải mã 22 Quá trình giải mã trình tự 23 Phƣơng pháp tạo phản ứng việc giải mã Các mục tiêu việc giải mã trình tự phân mảnh lớn DNA PP Walking (PP lặp phân đoạn) PP Shotgun (PP ngẫu nhiên) 24 3/25/2014 Phản ứng Walking Phản ứng giải mã trình tự cung cấp 500 bp trình tự thơng tin Việc giải mã 500 bp phụ thuộc vào trình tự thơng tin DT đoạn mã trước Quy trình phản ứng đạt tối đa 1kbase/2 ngày Việc giải mã trình tự tồn bộ genome 6,000,000 ngày 25 Phƣơng pháp Shotgun Lấy nhiều đoạn copy DNA ngẫu nhiên gen, giải mã trình tự 500bp từ đoạn DNA Sau xếp tất trình tự thành trình tự gen hoàn chỉnh Lƣu ý: Phải giải mã trình tự gen nhiều lần để chắn khơng bị trùng lặp thực nhiều phản ứng trình tự đồng thời lúc 26 So sánh Walking vs Shotgun Walking hiệu – giải mã trình tự lần Walking thường chậm hơn, đến 2-3 ngày để thiết kế tổng hợp mồi (primer) cho trình tự Shotgun hiệu giải mã trình tự ngẫu nhiên, cần phải giải mã trình tự 10 lần lặp lại Nhanh Walking – không cần tổng hợp thiết kế mồi (primer) – sử dụng loại giống cho tất phản ứng 27 3/25/2014 Giải trình tự ngẫu nhiên (Shotgun) Do J Craig Venter (1992), nhà sinh học phân tử tìm bỏ qua đồ liên kết đồ vật lý thay vào việc giải trình tự phân đoạn DNA ngẫu nhiên Hệ gen Haemophilus influenza lần công bố PP (1995) 28 Vận hành phƣơng pháp Shotgun Các phân mảnh phân chia ngẫu nhiên, trình tự phân mảnh phải giải mã để đảm bảo độ bao phủ tất trình tự Một số phân mảnh chứa nhiều thơng tin trình tự diện trình tự khác = đoạn lặp (overlaps) Các đoạn lặp cần thiết cho việc kết nối phân đoạn DNA lại với 29 Vận hành phƣơng pháp Shotgun Quy tắc chung – giải mã 10 lần kích cỡ gen để đảm bảo độ bao phủ hồn tồn trình tự giải mã VD: genome 5kbase=5000base, máy giải mã phải giải mã 5000*10/500 trình tự = 100 đoạn Để kết hợp lại, phải làm phép so sánh đoạn phân mảnh DNA (comparisons) = C(100,2) C(100,2) = 4,950 phép so sánh 30 10 3/25/2014 Các phép so sánh Có nhiều phép so sánh cần phải thực hiện, phải nhiều năm để tính tốn thời gian hồn thành 31 Triển vọng giải mã trình tự Định nghĩa & mô tả cấu trúc trật tự di truyền gen hay protein Dự đoán đƣợc thay đổi di truyền hệ 32 Các khó khăn giải mã trình tự Phải tiến hành phân mảnh genome trước giải mã Phải đạt 500 bp cho trình tự từ đoạn phân mảnh Đạt độ xác cao Sau kết thúc giải mã, trình tự phải đặt trở lại thành gen hoàn chỉnh Mỗi đoạn phân mảnh 500 bp phải liên tục so sánh với số đoạn trình tự phân mảnh 500 bp khác Kiểm tra độ xác 33 11 3/25/2014 Khó khăn giải mã trình tự Tìm kiếm biện pháp tối ƣu cho việc giải mã trình tự vừa xác, vừa tiết kiệm thời gian 34 CÁC HƢỚNG KHẮC PHỤC Giải pháp 1: Mơ hình huy động quỹ cộng đồng Giải pháp 2: Mơ hình hỗ trợ cá nhân 35 Giải pháp 1: Mơ hình huy động quỹ cộng đồng Phân chia genome thành “khúc” (chunks) lớn theo thứ tự định PP shotgun Những khúc xếp cầu thành đồ vật lý genome Đặt khúc vào thứ tự (bản đồ vật lý) tạo nên điểm cốt yếu thời gian Quay lại điểm sau giải mã Ƣớc lƣợng chi phí: 1000 ngƣời làm việc vòng 30 năm = tỷ US dollars 36 12 3/25/2014 Mô hình phân chia kết hợp 37 Mơ hình cộng đồng cho việc giải mã trình tự Genome ngƣời BƢỚC I: Cung cấp đồ vật chất genome BƢỚC II: Trình diễn (perform) phản ứng giải mã trình tự BƢỚC III: Kết hợp phân mảnh/miếng (piece) trình tự với 38 Bản đồ vật lý Bộ genome người –3.3 gigabase (Gb) (3.3 x 109 bp) Mỗi NST lớn để quan sát phân tích trình tự Khởi đầu genome phải phân đoạn thành miếng/mảnh nhỏ hơn, quan sát phân tích trình tự Làm phân mảnh – tạo nên nguồn nguyên liệu vô tận Tạo nên đồ vật chất để kết hợp mảnh nhỏ lại với để xây dựng đồ gene 39 13 3/25/2014 Ứng dụng thực 40 Sự phân đoạn Quyết định việc phát sinh đoạn DNA lặp (overlapping) Nguyên liệu khởi đầu hàng triệu NST – Sự phân cắt enzyme cắt hạn chế (RE disgestion) – Sự dịch chuyển học (Mechanical shearing) – Sự phân mảnh NST (Chromosomal separation) 41 Sự phân đoạn Enzyme cắt hạn chế (RE Digestion) Phân cắt enzyme cắt hạn chế (RE): mục tiêu cung cấp phân mảnh 10-150 kbase, RE có chiều dài khác nhau: –Nhóm RE 4-base cắt lần khoảng 256 bases/trình tự –Nhóm RE 6-base cắt lần khoảng 4096 bases/trình tự –Nhóm RE 8-base cắt lần khoảng 65 kbases/trình tự Tuy nhiên, thực tế, phần cắt mảnh DNA chủ yếu dùng nhóm RE base 42 14 3/25/2014 Sự phân đoạn 43 Sự phân đoạn Sự chia cắt vật chất NST thường sử dụng FACS (máy phân đoạn tế bào hoạt động gắn huỳnh quang – Fluorescent Active Cell Separator) Vạch đích huỳnh quang gắn vào NST & số lượng vạch đánh dấu đích cân xứng với kích cỡ NST Các giọt nhỏ giọt, loại chứa NST di chuyển qua đầu điện cực Sự di chuyển điện cực phổ biến thành giọt nhỏ đủ tiêu chí kích cỡ vạch nhuộm đích (dye) Một số giọt nhỏ bị lệch chia cắt từ số NST khác 44 Bất tử phân mảnh Bằng việc xây dựng ngân hàng genome – Đặt phân mảnh DNA vào sợi DNA thể VSV phòng thí nghiệm – Một phân mảnh/1 Vi khuẩn – Phân lập loại VSV – Có q trình chuẩn bị cho phân mảnh – Có thể phát triển vi khuẩn môi trường nuôi cấy để cung cấp số lượng lớn phân mảnh 45 15 3/25/2014 Cloning 46 Cloning Mỗi đoạn DNA đƣợc phân lập cách cấy đĩa loại vi khuẩn riêng lẻ Thực tế, phân mảnh đƣợc mã hóa (số hóa) cho việc theo dõi thuận tiện 47 Tìm kiếm đoạn lặp Đòi hỏi số cách tính tốn trình tự đoạn phân mảnh Sử dụng trình cắt hạn chế (Restriction digest) Xử lý qua điện di phân mảnh (gel agarose) 48 16 3/25/2014 Gel điện di agarose đƣợc sử dụng để chia cắt phân đoạn DNA dựa vào kích cỡ (size) Các đoạn lặp có số vạch chung giếng khác 49 Mơ hình hỗ trợ cá nhân Kế hoạch giải mã trình tự tồn bộ genome PP Shotgun Bỏ qua giai đoạn lập đồ vật chất & di truyền Phân mảnh genome, giải mã trình tự nhiều mảnh 500 bp sau cố gắng đặt chúng lại với Sử dụng phát minh –mơ hình cặp bạn bè (mate-pair) mơ hình khung giáo (scaffold) 50 Mơ hình “Mate-Pair” “Scaffold” Mã hóa mảnh thơng tin bổ sung cách đọc khoảng cách xác cặp trình tự Genome phân mảnh thành đoạn lặp biết chiều dài –2 kbase –10 kbase –50 kbase –150 kbase Giải mã trình tự đầu đoạn phân mảnh DNA 51 17 3/25/2014 Mô hình Shotgun thơng thƣờng Ngẫu nhiên phân mảnh giải mã đoạn DNA 500 bp, xác định đoạn lặp Mỗi nhóm phân đoạn lặp đƣợc gọi đoạn tiếp giáp (contig)= phân mảnh liền kề trình tự DNA 52 Mơ hình Shotgun qua Mate-Pair Phân mảnh sợi DNA thành đoạn lặp giống hệt kích thước trọng lượng (VD: 50 kbase) Các đoạn phân mảnh giống hệt chiều dài trọng lượng anh em nên gọi “Mate-Pair” 53 Mơ hình Shotgun Mỗi nhóm đoạn tiếp giáp riêng lẻ có phân đoạn “bạn bè” đầu đoạn DNA 50 kb đƣợc giải mã trình tự 54 18 3/25/2014 Mơ hình giàn khung (Scafffold) Scaffold thay cho việc lập đồ vật chất – quy trình thực nhanh Về lý thuyết, kết nối thành gen hồn chỉnh từ trình tự giải mã sử dụng mơ hình giàn khung Trình tự genome cuối kết nối hướng việc chứa đoạn khoảng trống (gaps) trình tự lặp Mơ hình kết hợp giúp cho việc bù đắp đoạn gaps Vì thế, mơ hình hỗ trợ cá nhân sử dụng thông tin đồ vật chất thiết kế mơ hình gây quỹ cộng đồng để giúp cho việc bù đắp đoạn gap 55 Mơ hình giàn khung (Scafffold) Các đoạn tiếp giáp gia nhập nhóm DNA bạn bè nên gọi mơ hình nhóm bạn bè (Mate-pairs) hướng theo đặt nhóm tiếp giáp liên quan với nhóm khác Khi ngày nhiều cặp bạn bè (mate-pair) so sánh, mơ hình giàn khung (scaffold) từ từ xây dựng 56 Mất bao lâu? Dự đoán đầu tiên: 30 năm Với ứng dụng KHKT với máy giải mã trình tự tự động (automated sequencer) bỏ qua việc tìm hiểu đồ vật lý cho genome người hồn chỉnh Một robot giải mã trình tự phòng TN giải mã trình tự 4.96 x 106 bases ngày Bộ genome người 3.3 x 109 bases NHƯNG cần đảm bảo độ bao phủ nên phải 3.3 x 1010 bases Tốn 6,653 ngày cho phòng thí nghiệm = 18 năm Xây dựng 20 phòng thí nghiệm có quy mơ PTN Giải mã tồn bộ genome khoảng 330 ngày 57 19 3/25/2014 Các hƣớng giải Một nhà máy giải mã trình tự tự động hóa 58 Tài liệu tham khảo http://www.the-scientist.com/?articles.view/articleNo/16654/ http://www.youtube.com/watch?v=8n2LvJ-m0n0&feature=related 59 KẾT THÚC CHƢƠNG V THANK YOU FOR YOUR ATTENTION! 60 20 ... truyền Giải mã trình tự (Gene Sequencing) Có phương pháp giải mã trình tự? Phương pháp giải mã trình tự tối ưu hơn? Tại sao? Mục đích cuối giải mã trình tự tồn bộ gen gì? Các bƣớc giải mã trình. .. nhiên gen, giải mã trình tự 500bp từ đoạn DNA Sau xếp tất trình tự thành trình tự gen hồn chỉnh Lƣu ý: Phải giải mã trình tự gen nhiều lần để chắn khơng bị trùng lặp thực nhiều phản ứng trình tự. .. máy giải mã trình tự tự động (automated sequencer) bỏ qua việc tìm hiểu đồ vật lý cho genome người hoàn chỉnh Một robot giải mã trình tự phòng TN giải mã trình tự 4.96 x 106 bases ngày Bộ genome
Ngày đăng: 22/11/2017, 20:06
Xem thêm: Giải mã trình tự toàn bộ bộ gen