KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

71 249 0
KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1) Dùng Perl script để thu nhận trình tự các nucleotide của ESTs của Citrus vừa tìm từ trang cơ sở dữ liệu GenBank NCBI. 2) Tìm và tách các đoạn microsatellite có thể có trong mỗi đoạn gen. 3) Tìm SSR nằm trên vùng gen kháng virus Tristeza iv 4) Tìm hiểu về mô hình dữ liệu quan hệ, sử dụng mô hình này vào việc lƣu trữ dữ liệu các trình tự nucleotide và trình tự SSRs của chi cam chanh (Citrus), và tạo cơ sở dữ liệu chứa những trình tự này. Sau đó đƣa các dữ liệu này vào cơ sở dữ liệu chính. 5) Trang web đƣợc thiết kế để chia sẻ thông tin trực tuyến với ngƣời dùng Kết quả Thu nhận đƣợc 191.110 trình tự ESTs của các loài Citrus đƣợc thu thập từ CSDL dbEST và CoreNucleotide của GenBank. Những trình tự ESTs này đƣợc tìm các vùng lặp lại, từ đó xác định đƣợc 28.241 SSRs trong 190412 ESTs . 19755 primers đƣợc thiết kế trên vùng flanking của các SSRs. Các primers này đã đƣợc kiểm tra sự lặp lại và sự bắt cặp đặc hiệu bằng BLAST. Cơ sở dữ liệu có 28241 trình tự SSRs đƣợc chuyển vào CSDL quan hệ và tích hợp vào website BUILDING SSRs DATABASE of Citrus. Sau khi đƣợc loại bỏ các trình tự tạp, nhiễu và dấu các trình tự ở các bào quan, trình tự lặp lại và trình tự vector, các trình tự ESTs đƣợc phân nhóm thành 2 nhóm Contigs và Singletons. Việc nhóm các trình tự giúp ích cho việc giảm bớt các trình tự dƣ thừa, kéo dài các EST-SSR và xác định các trình tự bảo tồn. Kết quả là thêm 1071 primers đƣợc thiết kế cho các EST-SSR đƣợc kéo dài. Ngoài ra, chúng tôi cũng xác định đƣợc 33 EST-SSRs tƣơng đồng gene kháng virus Tristeza bằng công cụ BLAST với ngƣỡng e-value = 10-

i BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NƠNG LÂM TP HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ SINH HỌC ************ KHÓA LUẬN TỐT NGHIỆP KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS) Ngành học: CƠNG NGHỆ SINH HỌC Niên khóa: 2003-2007 Sinh viên thực hiện: LƢU TRẦN CÔNG HUY Thành phố Hồ Chí Minh Tháng 9/2007 ii LỜI CẢM ƠN Xin gửi lòng biết ơn sâu sắc đến ba mẹ gia đình hết lịng hỗ trợ, động viên mặt để tơi hồn thành đề tài Xin chân thành cảm tạ Ban Giám hiệu Trƣờng Đại học Nông Lâm Thành Phố Hồ Chí Minh Ban chủ nhiệm Bộ Môn Công nghệ Sinh Học tất quý thầy cô truyền đạt kiến thức cho suốt trình học trƣờng Chân thành cảm ơn TS Trần Thị Dung tận tình hƣớng dẫn, giúp đỡ suốt thời gian thực đề tài tốt nghiệp Xin cảm ơn CN Lƣu Phúc Lợi giúp đỡ, hỗ trợ kiến thức tài liệu chuyên môn Xin cảm ơn bạn bè thân yêu lớp DH03SH chia sẻ vui buồn thời gian học nhƣ hết lòng hỗ trợ, giúp đỡ thời gian thực đề tài Tp Hồ Chí Minh tháng 08 năm 2007 Sinh viên thực Lƣu Trần Cơng Huy iii TĨM TẮT KHỐ LUẬN LƢU TRẦN CƠNG HUY, Đại Học Nơng Lâm TP Hồ Chí Minh, tháng 07/2007 “KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS)” Hội đồng hƣớng dẫn TS Trần Thị Dung Cử Nhân Lƣu Phúc Lợi Khóa luận đƣợc thực mơn Cơng Nghệ Sinh Học, trƣờng đại học Nơng Lâm TP Hồ Chí Minh, khoảng thời gian từ tháng 3/2007 đến 8/2007 Trong năm qua, sinh học không ngừng phát triển tạo kho liệu miễn phí trực tuyến lớn trình tự gene, protein, gene thực vật lẫn động vật nhƣ sở liệu sinh học lớn nhƣ NCBI, EMBL, DDBj… Một CSDL lớn ESTs (Expressed Sequence Tags), có ESTs chi cam chanh (citrus) Những trình tự ESTs đƣợc sử dụng để khai thác SSRs (Simple Sequence Repeats) Những SSRs hữu ích chúng có nhiều ứng dụng nhƣ genome mapping, phenotype mapping chọn giống thực vật nhờ marker phân tử Hơn nữa, việc phát triển marker SSR từ EST có chi phí thấp so với phƣơng pháp phân lập SSR truyền thống Để đạt đƣợc mục tiêu trên, khóa luận cần đảm bảo thực nội dung nhƣ sau: 1) Dùng Perl script để thu nhận trình tự nucleotide ESTs Citrus vừa tìm từ trang sở liệu GenBank NCBI 2) Tìm tách đoạn microsatellite có đoạn gen 3) Tìm SSR nằm vùng gen kháng virus Tristeza iv 4) Tìm hiểu mơ hình liệu quan hệ, sử dụng mơ hình vào việc lƣu trữ liệu trình tự nucleotide trình tự SSRs chi cam chanh (Citrus), tạo sở liệu chứa trình tự Sau đƣa liệu vào sở liệu 5) Trang web đƣợc thiết kế để chia sẻ thông tin trực tuyến với ngƣời dùng Kết Thu nhận đƣợc 191.110 trình tự ESTs loài Citrus đƣợc thu thập từ CSDL dbEST CoreNucleotide GenBank Những trình tự ESTs đƣợc tìm vùng lặp lại, từ xác định đƣợc 28.241 SSRs 190412 ESTs 19755 primers đƣợc thiết kế vùng flanking SSRs Các primers đƣợc kiểm tra lặp lại bắt cặp đặc hiệu BLAST Cơ sở liệu có 28241 trình tự SSRs đƣợc chuyển vào CSDL quan hệ tích hợp vào website BUILDING SSRs DATABASE of Citrus Sau đƣợc loại bỏ trình tự tạp, nhiễu dấu trình tự bào quan, trình tự lặp lại trình tự vector, trình tự ESTs đƣợc phân nhóm thành nhóm Contigs Singletons Việc nhóm trình tự giúp ích cho việc giảm bớt trình tự dƣ thừa, kéo dài EST-SSR xác định trình tự bảo tồn Kết thêm 1071 primers đƣợc thiết kế cho EST-SSR đƣợc kéo dài Ngồi ra, chúng tơi xác định đƣợc 33 EST-SSRs tƣơng đồng gene kháng virus Tristeza công cụ BLAST với ngƣỡng e-value = 10-10 v ABSTRACT LUU TRAN CONG HUY, NONG LAM UNIVERSITY, DATA MINING FOR DEVELOPING SIMPLE SEQUENCE REPEATS (SSR) MARKER IN EXPRESSED SEQUENCE TAGS (ESTs) FROM CITRUS Supervisor: Dr Trần Thị Dung Bsc Lƣu Phúc Lợi The research was carried out at the department of biotechnology at Nong Lam University Recent advances in genomic technologies have generated a vast amount of publicly available expressed sequence tags (ESTs) in Citrus These data can be mined to identify Simple sequence repeats (SSRs) or microsatellites These SSRs are useful because of a broad range of application, such as genome mapping and characterization, phenotype mapping, marker assisted selection of plant breeding, additional map-based cloning of important genes Moreover, this method of developing SSR marker from ESTs is inexpensive comparing to the traditional methods Methodology 1) We used perl script to receive EST sequences from database NCBI 2) Finded and separated SSRs include in ESTs database 3) We were learning about relationship database model to used to saved nucleotide, SSRs citrus sequences data and created database contain them 4) Finding SSR which are homologous with tristeza virus resistance gene 5) Designed web that contain database control software to share information with users Results: 28,241 SSR-containing ESTs (EST-SSRs) were identified by analyzing 191,110 ESTs sequences belonging to Citrus in dbEST division of GenBank 19,755 primers, which were filtered with repetition checking and BLAST checking, vi were designed in flanking regions of SSRs These data were put into relational database and integrated SSR finder tool into the BUILDING SSRs DATABASE of Citrus Website After cleaning, masking repeat, vector and organelle sequences, the EST-SSR sequences and the related EST sequences without SSRs were assembled into contigs and singletons, to reduce redundancy, to enlarge EST-SSRs for primer designed and to develop consensus sequences As a result, more 1071 primers were design for these enlarged EST-SSRs Using a stringent BLAST search with a threshold e-value = 10-10 against typical pathogen resistance gene database in Citrus, we identified 33 EST-SSRs which are homologous with tristeza virus resistance gene vii Mục Lục LỜI CẢM ƠN iii TĨM TẮT KHỐ LUẬN iv ABSTRACT vi DANH SÁCH CÁC TỪ VIẾT TẮT xi Chƣơng MỞ ĐẦU 1.1 Đặt vấn đề 1.2.Mục tiêu khóa luận Chƣơng TỔNG QUAN TÀI LIỆU 2.1 Giớ thiệu chi cam chanh 2.1.1 Vị trí phân lọai 2.1.2 Đặc điểm 2.1.3 Sâu hại bệnh tật 2.2 EST 2.3.1 Sơ lƣợc EST 2.3.2 Nguồn gốc EST 2.3.Sơ lƣợc phƣơng pháp Microsatellite (SSR) 2.3.1Những khái niệm kỹ thuật microsatellite 2.3.2 Giới thiệu chung 2.3.2.1 Tính chất 2.3.2.2 Khuếch đại microsatellites 10 2.3.2.3 Những giới hạn microsatellite 11 2.3.3 Các loại microsatellite 12 2.3.4 Cơ chế hình thành microsatellite 12 viii 2.3.5 Vai trò microsatellite 13 2.4 Phƣơng pháp xác định microsatellite truyền thống 15 2.5 Phƣơng pháp phát microsatellite sử dụng 16 2.6 Ứng dụng 18 2.7 Cơ sở liệu sinh học 18 2.7.1 NCBI 19 2.7.1.1 Vài nét NCBI 19 3.1.1.2 Một số sở liệu NCBI 19 Chƣơng 20 VẬT LIỆU VÀ PHƢƠNG PHÁP 20 3.1 Các chƣơng trình ngơn ngữ lập trình đƣợc sử dụng 20 3.1.1 Hệ điều hành 20 3.1.2 Các chƣơng trình phân tích trình tự 20 3.1.2.1 Chương trình Perl ssrfinder_1 20 3.1.2.2 Chƣơng trình tìm kiếm trình tự tƣơng đồng – BLAST 22 3.1.2.3 Hệ trị CSDL quan hệ Microsoft ACEESS 23 3.1.2.4 Egassembler 23 3.1.3 Apache web Server 24 3.4 CÁC BƢỚC TIẾN HÀNH 25 Chƣơng 37 KẾT QUẢ VÀ THẢO LUẬN 37 4.1 Thu thập trình tự ESTs Citrus từ CSDL dbEST 37 4.2 Loại liệu nhiễu dƣ công cụ EGassembler bao gồm bƣớc sau: 38 4.2.1 Làm trình tự 38 4.2.2 Dấu vùng trình tự nhiễu vector adaptors 39 4.2.3 Dấu vùng trình tự nhiễu bào quan 39 ix 4.3 Assembling 41 4.4 Tìm SSR: SSRFinder v1.0 Steven Schroeder 42 4.4.1 BLASTn: 43 4.5.Thiết kế kiểm tra primer 45 4.6 tBLASTx 48 4.7 Đƣa tất liệu vào CSDL quan hệ Microsoft ACCESS để dễ dàng truy xuất thông tin 49 4.8 Tích hợp CSDL vừa xây dựng vào web thơng qua Apache Server để chia thông tin qua mạng 49 4.8.1 Trang chủ (HOME PAGE) 49 4.8.2 Trang sở liệu SSRs (SSRs PAGE) 50 Chƣơng5 52 KẾT LUẬN VÀ ĐỀ NGHỊ 52 5.1 Kết luận 52 5.2 Đề nghị 53 TÀI LIỆU THAM KHẢO 54 Phụ Lục 57 x DANH SÁCH CÁC TỪ VIẾT TẮT BLAST Basic Local Alignment Search Tool CGI Common Gateway Interface CSDL Cơ sở liệu DBD Database Driver DBI Database Interface DNA deoxyribonucleic acid EST Expressed Sequence Tag HTML Hypertext Markup Language HTTP Hypertext Transfer Protocol NCBI the National Center for Biotechnology Information NIG the National Institute of Genetics NIH the National Institutes of Health NLM the Nation Library of Medicine Perl Practical Extraction and Report Language PHP Hypertext Preprocessior RDBMS Relational Database Management System SNP Single Nucleotide Polymorphism SSCP Single- Strand Conformation Polymorphism SSR Simple Sequence Repeats STS Sequence Tagged Site 45 Chúng phân lập thêm đƣợc lƣợng lớn trình tự EST từ trình tự EST thiết kế mồi ban đầu từ phân lập thiết kế thêm đƣợc 1071 primer SSR 4.5.Thiết kế kiểm tra primer Thiết kế primer Bảng 4.8 Tổng số primer thiết kế đƣợc Citrus aurantium (Seville orange) 413 Primers Citrus clementina 9608 Primers Citrus jambhiri (jambhiri orange) 69 Primers Citrus macrophylla (colo) 70 Primers Citrus reticulata x Citrus temple 97 Primers Citrus reticulata (tangerine) 352 Primers Citrus sinensis (apfelsine/navel orange) 8463 Primers Citrus unshiu (Satsuma orange) 171 Primers Citrus x paradisi (grapefruit) 1420 Primers Citrus sinensis x Poncirus trifoliata (Carrizo citrange) 94 Primers Citrus x paradisi x Pondcirus trifoliata 834 Primers Kiểm tra primer Bảng 4.9 Tổng số Primer lại sau kiểm tra Citrus aurantium (Seville orange) 391 Primers Citrus clementina 9181 Primers Citrus jambhiri (jambhiri orange) 67 Primers Citrus macrophylla (colo) 70 Primers Citrus reticulata x Citrus temple 94 Primers Citrus reticulata (tangerine) 348 Primers Citrus sinensis (apfelsine/navel orange) 8242 Primers Citrus unshiu (Satsuma orange) 168 Primers Citrus x paradisi (grapefruit) 1396 Primers Citrus sinensis x Poncirus trifoliata (Carrizo citrange) 86 Primers Citrus x paradisi x Pondcirus trifoliata 783 Primers Sau thiết kế kiểm tra primer xác định đƣợc 19,755 cặp mồi đạt yêu cầu đặt ra.So với tỉ lệ SSR ban đầu tỉ lệ trình tự thiết kế mồi cao 46 Hình 4.6: Bảng so sánh lƣợng Primers trƣớc sau kiểm tra 47 Hình 4.7: Bảng so sánh tổng trình tự SSRs Primers thiết kế đƣợc 48 Chúng xác định đƣợc lƣợng lớn cặp mồi đủ điều kiện đặt Đa số SSR tìm đƣợc thiết kế mồi 4.6 tBLASTx Chúng xác định đƣợc 33 EST-SSRs tƣơng đồng gene kháng virus Tristeza công cụ BLAST với ngƣỡng e-value = 10-10 Bảng 4.10 Các trình tự tƣơng đồng với gene kháng virus tristeza Mã số CX052406.1a CN182797.1a DN799259.1a CV718404.1a Contig1678a CX290096.1a DR908292.1a DN620117.1a CX053145.1a V715355.1a DY302690.1a DY293832.1a DY284674.1 DY269563.1a Contig1685a DY304067.1a DY301664.1a DY294592.1a DY267783.1a DY265810.1a DY263066.1a CX078270.1a CX052405.1a CX070771.1a CN182794.1a CV719546.1a DY276141.1b CV719898.1a DN958924.1a CV714983.1 BQ624932.1a DY279874.1 Lòai Citrus sinensis Citrus sinensis Citrus reticulata x Citrus sinensis Citrus sinensis Citrus clementina Citrus sinensis Citrus sinensis Citrus sinensis Citrus sinensis Citrus clementina SSR ACACACACACAC Motif AC AGAGAGAGAGAG AG AGAAGAAGAAGA AGA AGCAGCAGCAGC ATAATAATAATA ACCACCACCACC AGC ATA ACC Citrus clementina ATCATCATCATCATC ATC Citrus sinensis Citrus sinensis Citrus sinensis TATATATATATA TGTGTGTGTGTG TCATCATCATCA TA TG TCA Citrus sinensis Citrus clementina Citrus sinensis Citrus x paradisi Citrus sinensis Citrus sinensis Citrus clementina TGGTGGTGGTGG TCGTCGTCGTCG CCTCCTCCTCCT TGG TCG CCT CCACCACCACCA CGACGACGACGA CGACGACGACGA CCA CGA CGA 49 CX296075.1a Citrus sinensis Poncirus trifoliata x TCTCTCTCTCTCTCTC TCTC Các ESTs-SSRs tƣơng đồng gene kháng virus Tristeza chủ yếu đƣợc phát hai loài Citrus Clementina Citrus Sinensis lƣợng trình tự EST-SSRs lớn (hình 4.1) Ở lòai khác số lƣợng ESTs đƣợc giải mã khơng nhiều nên chƣa tìm đƣợc ESTs-SSRs tƣơng đồng gene kháng virus Tristeza 4.7 Đƣa tất liệu vào CSDL quan hệ Microsoft ACCESS để dễ dàng truy xuất thơng tin Hình 4.8 : Mối quan hệ bảng 4.8 Tích hợp CSDL vừa xây dựng vào web 4.8.1 Trang chủ (HOME PAGE) Hình 4.9: Tổng quan Website 50 Nội dung trang web: Gồm lựa chọn để liên kết đến trang web chứa thông tin sở liệu khác 4.8.2 Trang sở liệu SSRs (SSRs PAGE) Nội dung trang web: Chứa sở liệu trình tự microsatellite chi cam chanh (citrus) gồm có: Thể tất sở liệu SSRs (All): loại SSRs đƣợc thể hiện, không đƣợc phân loại Hình thức thể hiện: Hình 4.10 Trang sở liệu SSRs (All) Tìm kiếm trình tự cần thiết: Tìm kiếm theo “StrainId” “MotifLengthGroup”: Khi ngƣời dùng quan tâm đến nhóm microsatellite Bảng 4.11: Các nhóm Strain id có sở liệu StrainID ST01 ST02 ST03 ST04 ST05 ST06 Name Citrus clementina Citrus sinensis Citrus jambhiri Citrus aurantium Citrus macrophylla Citrus reticulata 51 ST07 Citrus sinensis x Poncirus trifoliata ST08 Citrus unshiu ST09 Citrus x paradisi ST10 Citrus reticulata x Citrus temple ST11 Citrus x paradisi x Pondcirus trifoliata Bảng 4.12 Các nhóm Motif sở liệu Motif Length Motif Length Group ID Group Dimer Trimer Tetramer Pentamer Hexamer Heptamer Octamer Nonamer 10 Decamer 72 Dodecamer Hình thức thể hiện: Description Dinucleotide SSR Trinucleotide SSR Tetranucleotide SSR Pentanucleotide SSR Hexanucleotide SSR Heptanucleotide SSR Octanucleotide SSR Nonanucleotide SSR Decanucleotide SSR Dodecamer SSR Hình 4.11 Trang sở liệu SSRs chọn lọc theo Strain Id “ST01” “Motif Length Group ID” 52 Chƣơng KẾT LUẬN VÀ ĐỀ NGHỊ 5.1 Kết luận Đề tài gồm bƣớc đƣợc thực lần lƣợt nhằm mục đích xác định cách xác SSRs thiết kế mồi cho SSR Chúng tơi tải đƣợc 191,110 trình tự ESTs chi Citrus bao gồm 11 loài khác nhau, tiến hành loại nhiễu Egassembler lọai bỏ đƣợc 1725 trình tự ESTs khơng phù hợp yêu cầu Tiến hành Assembly Các trình tự ESTs vừa thu nhận đƣợc Egassembler thu nhận đƣợc 24278 Contigs Blast trình tự ESTs khơng thể thiết kế mồi Contigs phân lập đƣợc thêm 7635 ESTs 28241 trình tự SSRs đƣợc phân lập nhờ Perl script từ sở liệu ESTs ban đầu Kiểm tra thiết kế mồi cho SSRs tìm đƣợc, chúng tơi xác định đƣợc 19,755 cặp mồi Tiến hành Blast sở liệu gen kháng virus tristeza xác định đƣợc 33 ESTs-SSRs có motif tƣơng đồng với motif gen kháng virus Tích hợp tất sở liệu thu nhận đƣợc vào website SSRs Database of Citrus Trang Web sở liệu gồm có trang chính, HOME, Citrus, ABOUT SSRs, SSRs, TOOLS, ABOUT US, Other Links Ngồi ra, từ trang web cịn kết nối đến trang phụ khác để cung cấp tiện ích cho ngƣời dùng Từ trang web này, ngƣời sử dụng truy xuất thơng tin 53 Về chúng tơi tìm, thu nhập phân lập hầu hết ESTs-SSRs chi cam chanh đƣợc công bố NCBI 5.2 Đề nghị Nên cập nhật sở liệu theo định kỳ lƣợng trình tự đƣợc giải mã cơng bố ngày nhiều để đảm bào tính cấp bách phong phú Website Mở rộng sở liệu sang chi, lòai khác nhằm phục vụ cho nhu cầu nghiên cứu tìm hiểu Cần thiết lập thêm bẫy lỗi đƣợc trình bày bƣớc để đảm bảo việc hạn chế trùng lắp liệu không cần thiết nhập Xây dựng nhiều trang web chứa thơng tin tìm kiếm công cụ (assembly, thiết kế primer, enzyme cắt giới hạn, xây dựng mơ hình cấu trúc,…) phục vụ cho việc khai thác thông tin ứng dụng khác Tiến hành thiết kế mồi chung phục vụ cho phản ứng PCR phân biệt loài họ họ thông qua trang web thiết kế primer trực tuyến Internet nhƣ GeneFisher, Primer3,… hay xây dựng trang web chứa công cụ phục vụ cho thiết kế primer nhƣ GPRIME, Primer3,…kết hợp với ngơn ngữ lập trình Perl 54 Chƣơng TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT Trần Nguyễn Minh Đăng, 2005 XÂY DỰNG CƠ SỞ DỮ LIỆU SSRS (SIMPLE SEQUENCE REPEATS) TỪ ESTS (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh Nguyễn Minh Đạo, 2002 MS-Access 2000 Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thông Tin Nguyễn Thị Lang – Bùi Chí Bửu, 2005 Sinh học phân tử Giới thiệu phương pháp ứng dụng Nhà xuất nông nghiệp TP HCM Bùi Huy Quỳnh, 2002 Front Page 2000 Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thông Tin Nguyễn Trƣờng Sinh – Lê Minh Hoàng – Hoàng Đức Hải, 2003 Thực hành JavaScript (cho web) Nhà xuất Thống Kê Nguyễn Văn Thái, 2005 Xây dựng sở liệu hai gene Hsp-70 Reverse Transcripte-Rnaseh số lồi virus thực vật Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh Nguyễn Kỳ Trung – Lê Thành Trung, 2005 Thu thập tổ chức liệu gene phục vụ nghiên cứu trồng biến đổi di truyền Khóa luận tốt ngiệp Ngành Cơng nghệ sinh học, Đại học Nơng lâm TP Hồ Chí Minh TÀI LIỆU NƢỚC NGOÀI 8.Acquadro A., Lee D., Donini P., Portis E., Comino C., Saba E., Lanteri S., 2003 Microsatellite Amplified Library (MAL): an alternative approach for STMS isolation Bologna – Italy 9.Ali Masoudi-Nejad, Ruy Jauregui, Shuichi Kawashima, Susumu Goto, Minoru Kanehisa, Takashi R Endo, 1999.The kingdom of Plantae EST Indices: a resource for plant genomics community 10.Altschul, Stephen F., Thomas L Madden, Alejandro A Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res 25:3389-3402 55 11.Andrew J Robinson , Christopher G Love , Jacqueline Batley ,Gary Barker and David Edwards, 2004 Simple sequence repeat marker loci discovery using SSR primer 12.Andrew Salywon, Matthew Barber, Nathan Herling, and William Stewart 2005 Data mining for microsatellites in expressed sequence tags (ESTs) from arabidopsis thaliana and brassica species (brassicaceae) 13.A Story Book Future for Lesquerella? Agricultural Research Magazine (1999) November Benson, G, 1999 Tandem repeats finder: a program to analyze DNA sequences Nucleic Acids Res 27, 573–580 14.Castelo, A.T et al., 2002 Troll – Tandem Repeat Occurrence Locator Bioinformatics 18, 634–636 Huang, X and Madan, A., 1999 CAP3: A DNA sequence assembly program Genome Research, 6: 829–845 15.Edward F Gilman, 1999 Ananas comosus University of Florida Jorge A Da Silva , Nora Solis-Gracia, 2003.Tagging resistance genes with sugarcane estderived microsatellites 16.Huang, X and Madan, A., 1999 CAP3: A DNA sequence assembly program Genome Research, 6: 829–845 17.Kantety, R.V., M.L Rota, D.E Mathews, and M.E Sorrells, 2002 Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat Plant Mol Biol Rep 48:501-510 18.K.D Scott, Microsatellites Derived from ESTs and their Comparison with those Derived by Other Methods Centre for Plant Conservation Genetics, Southern Cross University, Lismore, Australia 19.Morgante M., Hanafey M., and Powell W, 2002 Microsatellites are preferentially associated with non repetitive DNA in plant genomes Nature Genetics 30:194-200 20.Morgante, M and Olivieri, A.M., 1993 PCR-amplified microsatellites as markers in plant genetics Plant J 3, 175–182 21.Morgante, M et al., 2002 Microsatellites are preferentially present with nonrepetitive DNA in plant genomes Nat Genet 30, 194–200 22.P K Gupta, H S Balyan, P C Sharma and B Ramesh, 2000.Microsatellites in plants: A new class of molecular markers 56 23.Rozen, S., Skaletsky, H "Primer3 on the WWW for general users and for biologist programmers." In S Krawetz and S Misener, eds Bioinformatics Methods and Protocols in the series Methods in Molecular Biology Humana Press, Totowa, NJ, 2000, pages 365-386 Code available at http://fokker.wi.mit.edu/primer3/ 24.Ramesh V Kantety, Mauricio La Rota, David E Matthews and Mark E Sorrells, 2002 Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat Kluwer Academic Publishers 25.Win Hide, Rob Miller, Andrey Ptitsyn, Janet Kelso, Chellapa Gopallakrishnan and Alan Christoffels, 1999 EST Clustering Tutorial TÀI LIỆU TỪ CÁC TRANG WEB: 26.< http://210.212.212.7:9999/PHP/SILKSAT/index.php?f=protocol_ssr > 27 29.< http://vi.wikipedia.org/wiki/ chi cam chanh > 30. 32.< http://www.maizemap.org/bioinformatics/SSRFINDER/ > 33.< http://www.ncbi.nlm.nih.gov/About/primer/est.html > 34.< http://www.ncbi.nlm.nih.gov/BLAST/download.shtml > 35.< http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml > 36.< http://www.ncbi.nlm.nih.gov/BLAST/full_options.html > 37.< http://www.ncl-india.org/ssr/ssr.htm > 38.< http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results.cgi > 39.< http://www.tc.cornell.edu/WBA/ > 57 Phụ Lục Trang thông tin Citrus (Citrus PAGE) Nội dung trang web: Giới thiệu cách tổng quát chi cam chanh citrus Tổng quan Citrus Trang thông tin microsatellite (ABOUT SSRs PAGE) Nội dung trang web: Giới thiệu chung phƣơng pháp microsatellite Trang Microsatellites Trang tích hợp cơng cụ để tìm kiếm SSR 58 Dùng để tìm trình tự microsatellite sở liệu website, kết hiển thị kết đoạn SSR tìm đƣợc Trang web tìm kiếm trình tự microsatellite mã số truy cập Trang web tìm kiếm trình tự microsatellite Motif 59 Trang cơng cụ Trang tích hợp cơng cụ để tìm kiếm SSR Dùng để tìm trình tự microsatellite từ trình tự hay upload file định dạng FASTA, kết hiển thị kết đoạn SSR tìm đƣợc Trang web tìm kiếm trình tự microsatellite Tuy nhiên, Website dần đƣợc hoàn thiện để thức đƣa vào sử dụng trực tuyến .. . TP Hồ Chí Minh, tháng 07/2007 ? ?KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS)? ?? Hội đồng hƣớng dẫn TS .. . /sputnik/index.html], 3.CUGIssr [http://www.genome.clemson.edu/projects /ssr/ ] 4.SSRSEARCH [ftp://ftp.gramene.org/pub/gramene/software/scripts /ssr. pl] 22 5.SSRFinder [http://www.maizemap.org/bioinformatics /.. . tìm SSR trình tự nhƣ: 1 .SSR Server [http://www.bioinfo.wsu.edu/cgi-bin/gdr/gdr _ssr] SSR Primer Discovery [http://hornbill.cspp.latrobe.edu.au/cgibinpub/ssrprimer/indexssr.pl] SSRIT [http://www.gramene.org/db/searches/ssrtool]

Ngày đăng: 03/09/2013, 10:00

Hình ảnh liên quan

Hình 2.1. CTV dƣới KHV điện tử - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 2.1..

CTV dƣới KHV điện tử Xem tại trang 18 của tài liệu.
Hình 2.2: Nguồn gốc của EST 2.3.Sơ lƣợc về phƣơng pháp Microsatellite (SSR)  2.3.1Những khái niệm về kỹ thuật microsatellite  - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 2.2.

Nguồn gốc của EST 2.3.Sơ lƣợc về phƣơng pháp Microsatellite (SSR) 2.3.1Những khái niệm về kỹ thuật microsatellite Xem tại trang 20 của tài liệu.
2.3.4 Cơ chế hình thành microsatellite - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

2.3.4.

Cơ chế hình thành microsatellite Xem tại trang 24 của tài liệu.
Hình 2.4 Cơ chế trƣợt lỗi trong quá trình sao mã 2.3.5 Vai trò của microsatellite  - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 2.4.

Cơ chế trƣợt lỗi trong quá trình sao mã 2.3.5 Vai trò của microsatellite Xem tại trang 25 của tài liệu.
Hình 2.5: Phƣơng pháp phân lập microsatellite truyền thống 2.5 Phƣơng pháp phân lập microsatellite sử dụng  - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 2.5.

Phƣơng pháp phân lập microsatellite truyền thống 2.5 Phƣơng pháp phân lập microsatellite sử dụng Xem tại trang 28 của tài liệu.
Bảng 3. 2: Từ khóa sử dụng để thu nhận trình tự trên NCBI - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 3..

2: Từ khóa sử dụng để thu nhận trình tự trên NCBI Xem tại trang 38 của tài liệu.
Bảng 3.1 Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 3.1.

Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI Xem tại trang 38 của tài liệu.
Hình 3. 1: Danh sách các trình tự EST Citrus trên NCBI (www.NCBI.nlm.nih.gov/genomes/plant/plantlist.html#est)  - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 3..

1: Danh sách các trình tự EST Citrus trên NCBI (www.NCBI.nlm.nih.gov/genomes/plant/plantlist.html#est) Xem tại trang 39 của tài liệu.
Hình 3. 2: Các bƣớc thực hiện của EGassembler - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 3..

2: Các bƣớc thực hiện của EGassembler Xem tại trang 41 của tài liệu.
Mỗi đối tƣợng trong mô hình đối tƣợng là một quan hệ trong mô hình quan hệ.  - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

i.

đối tƣợng trong mô hình đối tƣợng là một quan hệ trong mô hình quan hệ. Xem tại trang 46 của tài liệu.
Nhập dữ liệu vào bảng - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

h.

ập dữ liệu vào bảng Xem tại trang 47 của tài liệu.
Bảng 4.1 số lƣợng ESTs của từng loài thu nhận đƣợc từ NCBI - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.1.

số lƣợng ESTs của từng loài thu nhận đƣợc từ NCBI Xem tại trang 49 của tài liệu.
Hình 4.1: Sơ đồ so sánh lƣợng ESTs của từng loài - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.1.

Sơ đồ so sánh lƣợng ESTs của từng loài Xem tại trang 49 của tài liệu.
Bảng 4.4 số trình tự bị lọai bỏ ở bƣớc 2.4 - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.4.

số trình tự bị lọai bỏ ở bƣớc 2.4 Xem tại trang 51 của tài liệu.
Hình 4.2: Bảng so sánh dữ liệu ESTs trƣớc và sau khi lọai nhiễu - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.2.

Bảng so sánh dữ liệu ESTs trƣớc và sau khi lọai nhiễu Xem tại trang 52 của tài liệu.
Hình 4.3: Bảng so sánh lƣợng Contigs và ESTs - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.3.

Bảng so sánh lƣợng Contigs và ESTs Xem tại trang 53 của tài liệu.
Bảng 4.5 số lƣợng Contigs thu đƣợc ở mỗi lòai sau khi assembling - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.5.

số lƣợng Contigs thu đƣợc ở mỗi lòai sau khi assembling Xem tại trang 53 của tài liệu.
Hình 4.4: Biểu đồ so sánh lƣợng SSRs phân lập và lƣợng ESTs ban đầu - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.4.

Biểu đồ so sánh lƣợng SSRs phân lập và lƣợng ESTs ban đầu Xem tại trang 55 của tài liệu.
Bảng 4.7 Lƣợng trình tự ESTs và số primer mới đƣợc tạo thành - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.7.

Lƣợng trình tự ESTs và số primer mới đƣợc tạo thành Xem tại trang 55 của tài liệu.
Hình 4.5: Biểu đồ so sánh lƣợng noneprimers và ESTs, Primers mới - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.5.

Biểu đồ so sánh lƣợng noneprimers và ESTs, Primers mới Xem tại trang 56 của tài liệu.
Bảng 4.8 Tổng số primer thiết kế đƣợc - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.8.

Tổng số primer thiết kế đƣợc Xem tại trang 57 của tài liệu.
Bảng 4.9 Tổng số Primer còn lại sau khi kiểm tra - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.9.

Tổng số Primer còn lại sau khi kiểm tra Xem tại trang 57 của tài liệu.
Hình 4.6: Bảng so sánh lƣợng Primers trƣớc và sau khi kiểm tra - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.6.

Bảng so sánh lƣợng Primers trƣớc và sau khi kiểm tra Xem tại trang 58 của tài liệu.
Hình 4.7: Bảng so sánh tổng trình tự SSRs và Primers thiết kế đƣợc - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.7.

Bảng so sánh tổng trình tự SSRs và Primers thiết kế đƣợc Xem tại trang 59 của tài liệu.
Bảng 4.10 Các trình tự tƣơng đồng với gene kháng virus tristeza - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.10.

Các trình tự tƣơng đồng với gene kháng virus tristeza Xem tại trang 60 của tài liệu.
Hình 4.9: Tổng quan về Website - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4.9.

Tổng quan về Website Xem tại trang 61 của tài liệu.
Hình 4. 8: Mối quan hệ giữa các bảng 4.8 Tích hợp CSDL vừa xây dựng vào web   - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Hình 4..

8: Mối quan hệ giữa các bảng 4.8 Tích hợp CSDL vừa xây dựng vào web Xem tại trang 61 của tài liệu.
Bảng 4.11: Các nhóm Strain id có trong cơ sở dữ liệu - KHAI THÁC D. LI.U ESTs (EXPRESSED SEQUENCE TAGs) . CHI CAM CHANH (CITRUS) CHO VI.C PHÁT TRI.N MARKER PHÂN T. SSR (SIMPLE SEQUENCE REPEATS)

Bảng 4.11.

Các nhóm Strain id có trong cơ sở dữ liệu Xem tại trang 62 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan