GIÁO TRÌNH DI TRUYÊN SÔ LƯỢNG part 2 pot

Bảng 6: Tần suất của MC combinations Bảng 7: Tần suất của MC combinations trong quần thể giao phối ngẫu nhiên với tính trội Mẹ Con Mẹ Con AA Aa aa Cộng A- aa Cộng AA p 2 p 2 q p 2 A- p(1 + pq) pq 2 p 2 + 2pq Aa p 2 q pq pq 2 2pq aa pq 2 q 3 q 2 Aa p q 2 q 3 q 2 Cộng q 2 2pq q 2 1.00 Cộng p 2 + 2pq q 2 1.00 Khi A trội đối với a, sẽ có 4 phối hợp có tính chất kiểu hình MC. Tần suất của nó có trong bảng 7, bao gồm phần tế bào không thể phân chia được ở bảng 6 I-3-5. ƯỚC ĐOÁN TẦN SUẤT GEN TỪ SỐ LIỆU MC Bảng 8: Số liệu quan sát các nhóm máu MC combinations Con Tổng số (mẹ) Mẹ M MN N M a1 a2 a1 + a2 MN a3 a4 a5 a3 + a4 + a5 N a6 a7 a 6 + a 7 Tổng số (con) a1 + a3 a2 + a4 + a6 a5 + a7 Thí dụ: xem xét nhóm máu M-N ở người, a là số mẫu quan sát của từng cặp MC và Σ a = G (tổng số cặp MC) bao 2G cá thể với 4G gen. Chúng ta có thể ước đoán tần suất gen trên cơ sở G mothers hoặc trên cơ sở G children, nhưng tiến trình nầy sẽ loại bỏ càc tính hiệu có từ G cá thể khác. Chúng ta có thể xem xét tần suất gen từ giá trị tổng số cận biên (pooled marginal totals) của mẹ và con, áp dụng phương pháp [1]. Cách tính nầy có khó khăn là 2G cá thể không độc lập, vì vậy chúng ta không có 4G gen độc lập trong mẫu, phương sai dự đoán sẽ không phải là pq/4G như công thức [1V]. Vì mỗi đứa trẻ phải chia một gen với mẹ của nó, nên chỉ có 3 gen độc lập trên từng cặp MC (cho dù tạm thời 4 gen đều có mặt). Phương pháp tốt nhất để dự đoán tần suất gen từ MC pairs là tối đa hóa số cá thể phối hợp a1, a2, a7, với xác suất tương ứng theo bảng 6 L = a1 logp 3 + ( 2 + a3) logp 2 q + a4 logpq + (a5 + a6) logpq 2 + a7 logq 3 Vì logp 2 q = 2 logp + logq L = B logp + C logq Trong đó B = 3a1 + 2 (a2 + a3) + a4 + (a5 + a6) Và C = (a2 + a3) + a4 + 2 (a5 + a6) + 3a7 Ghi chú B + C bao gồm 3 của mỗi nhóm a, trừ a4 B + C = 3C - a4. Đặt dL/ dp = 0 giải ra p chúng ta được: B 3a1 + 2(a2 + a3) + a4 + (a5 + a6) p = = [6] B + C 3G - a4 V(p) = pq / (B + C) = pq / (3G - a4) [6V] Mỗi phối hợp mẹ máu M và con máu M có 3 gen M độc lập, dó là 3 a1. Đối với mẹ máu M, con máu MN thì gen M của con chắc chắn được truyền từ mẹ nó, nhưng gen N là một yếu tố độc lập. Như vậy có 2 gen M, không có trong 3 gen độc lập, đó là 2 a2, và cứ thế tiếp tục. Chú ý phối hợp mẹ MN con MN phải được đề cập cho dù phải có 2 gen độc lập, bởi vì trong phối hợp nầy chúng ta không có cách nói khác: M gen hoặc N gen của con xuất phát từ mẹ của nó. Vì một cặp MN-MN có giá trị 2 gen độc lập và tần suất của nó trong quần thể giao phối ngẫu nhiên là pq, tất cả các cặp có 3 gen độc lập, cho nên giá trị trung bình của một cặp MC là: 2 x pq + 3x (1 - pq) = 3 = pq genes [7] Giá trị tối đa của pq là 1/4, nên giá trị tối thiểu từng cặp MC là 3.00 - 0.25 = 2.75 số gen độc lập. Trong trường hợp nhóm máu M-N giá trị p và q gần bằng 1/2, phối hợp MN-MN biến động nhiều hơn so với các phối hợp khác trong quần thể, do đó làm thấp đi giá trị trung bình trên từng cặp MC gần với giá trị tối thiểu. Nếu cả p và q đều nhỏ, giá trị trung bình trên cặp bố mẹ - con sẽ rất gần với 3 gen độc lập. Nói cách khác, một bố mẹ và một con gần bằng với 1.5 các cá thể độc lập. Bài tập 1. Ước đoán thành phần của thế hệ kế tiếp trong điều kiện giao phối ngẫu nhiên của quần thể khởi thủy như sau 0,16 : 0,48 : 0,36 2. Tìm tần suất phân bố của 3 kiểu gen trong thế hệ tiếp theo với giá trị ban đầu như sau (trong đó, các cá thể giao phối ngẫu nhiên) (0,25 : 0,10 : 0,65) ; (0,30 : 0 : 0,70) ; (0 : 0,60 : 0,40) 3. Kiểm soát những quần thể sau đây có phân bố cân bằng (equilibrium) và tính tỉ lệ cân bằng xem xét kết qủa đạt được có đúng hay không (0,50 : 0 : 0,50) ; (25 : 10 : 1) ; (0,36 : 0,15 : 0,49) ; (1 : 1: 1/4) (0,09 : 0,10 : 0,81) ; (0,45 : 0,45 : 0,10) ; (0,5625 : 0,3750 : 0,0625) 4. Xác định tỉ lệ phân bố của quần thể với 5% alen lặn trong dị hợp tử Trả lời: 2 (1 - [0,05] 1/2 ).(0,05) 1/2 = 34,7% 5. Wiener (1950) đã báo cáo rằng tần suất của phối hợp mẹ-con trong trường hợp nhóm máu M-N như sau Con Mẹ M MN N Tổng M MN N 93 69 0 74 151 59 0 60 50 167 280 109 Tổng 162 284 110 556 Hãy ước đoán tần suất gen và sai số chuẩn 6. Nếu kết qủa là 5% dominants trong quần thể, thì phần trăm của dị hợp tử là bao nhiêu? Trả lời: H= 2 ( 1 - 0,95 1/2 ) (0,95 1/2 ) = 4,936% Tần suất của AA = ( 1 - 0,95 1/2 ) = 0,02532 2 = 0,064% Người ta thấy rằng: ưu thế chính của dominants là dị hợp tử, do đó, Aa x aa sẽ tiến dần đến AA x aa Chương 2 PHÂN TÍCH TÍNH ĐA DẠNG VỀ DI TRUYỀN Phương pháp đo lường khoảng cách của các nhóm trên cơ sở nhiều tính trạng khác nhau được đề xuất (Mahalanobis 1928). Phương pháp nầy còn được gọi là hiệu số "bình phương" (D 2 - Mahalonobis). Các bước phân tích bao gồm: (i) Thu thập số liệu (ii) Trắc nghiệm mức độ ý nghĩa (iii) Chuyển đổi các giá trị (iv) Tính hiệu số D 2 (v) Trắc nghiệm mức độ ý nghĩa của D 2 với phép thử Chi bình phương (vi) Mức độ đóng góp của các tính trạng vào sự phân nhóm. (vii) Xếp nhóm các cluster di truyền: - Phương pháp Tocher - Canonical graph. Chương trình phân tích đã có trong cá mô hình thống kê sinh học Trước tiên, chúng ta thiết lập một ma trận có chứa các giá trị phương sai (variance) và hợp sai (covariance) giữa các tính trạng có quan hệ với nhau, để tìm ra các phương trình biến đổi của các biến số có tương quan. Kế đến tính D 2 từng cặp giá trị và phân nhóm di truyền. Tính khoảng cách di truyền trong từng nhóm và giữa các nhóm. Các genotypes ở cùng một nhóm ít khác biệt hơn kiểu gen ở nhóm khác. Hệ số D ở trong nhóm nhỏ hơn rất nhiều so với hệ số D giữa các nhóm. Có ba đặc điểm quan trọng trong khi chọn lựa các genotypes là: - Chọn nhóm có genotype làm bố mẹ. - Chọn các genotypes ở trong nhóm có khoảng cách di tryuền với các nhóm khác càng xa càng tốt. - Chú ý các tính trạng có mức độ đóng góp cao nhất về độ khác biệt về di truyền. Phải tiếp tục thực thiện việc lai thử nghiệm, mới có kết luận cụ thể về ưu thế lai giữa hai nhóm có khoảng cách xa, cũng như sự phân ly của các dòng con lai. 2-1. PHƯƠNG SAI & HỢP SAI (variance, covariance) (Σx) 2 Σx 2 - n Var x = (phương sai) n - 1 Σxy - (ΣxΣy) / n Cov xy = (hợp sai) n –1 Phương pháp metroglyph và tính chỉ số điểm đánh giá đã được Anderson đề nghị từ năm 1957. Sau đó, rất nhiều tác giả khác đã phát triển phương pháp này như Ramanujam và Kumar (1964), Mukherjee và ctv.(1971), Venketrao và ctv. (1973) 2-2. HIỆU SỐ D 2 pD 2 = b 1 d 1 + b 2 d 2 + b 3 d 3 + + bpdp pD 2 = Wij (mean xi 1 - mean xi 2 ) (mean xj 1 - mean xj 2 ) Trong đó Wij là ma trận của các giá trị phương sai và hợp sai của những tính trạng mục tiêu được sử dụng để phân tích mức độ đa dạng di truyền Các bước tính toán được tiến hành theo trình tự sau 1. Phân tích ANOVA và ANCOVA của các tính trạng mục tiêu 2. Tìm phương sai kiểu gen và phương sai kiểu hình, hợp sai kiểu gen và hợp sai kiểu hình 3. Sắp xếp ma trận của các giá trị phương sai và hợp sai tương ứng theo cột và hàng của ma trận [G] kiểu gen và [P] kiểu hình. Trong trường hợp chung, chúng ta có thể chỉ cần sử dụng ma trận [G]. Trường hợp bố trí thí nghiệm không có lập lại, phương sai và hợp sai được tính theo một dãy số, không có bảng ANOVA và ANCOVA, chúng ta chỉ có một matrix duy nhất. 4. Giải ma trận theo cách trình bày kiểu “pivotal” (kiểu rễ đuôi chuột). Vế bên trái của hệ thống phương trình là ma trận của các giá trị phương sai, hợp sai. Bên phải là ma trận đơn vị tương ứng. Thí dụ nếu chúng ta phân tích trên 4 tính trạng mục tiêu, ma trận đơn vị sẽ là 1 0 0 0 (1) 0 1 0 0 (2) 0 0 1 0 (3) 0 0 0 1 (4) 5. Chuyển đổi giá trị của các biến số. Thí dụ chúng ta có 4 tính trạng mục tiêu, giá trị chuyển đổi sẽ được tính theo công thức như sau: X 1 Y 1 = (σ 2 X 1 ) 1/2 trong đó σ 2 X 1 là phương sai của tính trạng 1 aX 1 + X 2 Y 2 = (A) 1/2 trong đó a là hệ số kết qủa cột 1 của hệ phương trình (2) trong ma trận đơn vị khi tính tóan. A là hệ số kết qủa của số đầu tiên bên vế trái khi tính toán, tương ứng với hệ phương trình (2) bX 1 + cX 2 + X 3 Y 3 = (B) 1/2 trong đó b là hệ số kết qủa của cột 1, c của cột 2 trong hệ phương trình (3), trong ma trận đơn vị khi tính toán, và B là hệ số kết qủa của số đầu tiên bên vế trái của hệ phương trình (3) eX 1 + fX 2 + gX 3 + X 4 Y 4 = (C) 1/2 trong đó e là hệ số kết qủa của cột 1, f của cột 2, g của cột 3 trong hệ phương trình (4), trong ma trận đơn vị khi tính toán, và C là hệ số kết qủa của số đầu tiên bên vế trái của hệ phương trình (4) Như vậy chúng ta sẽ có hệ phương trình chuyển đổi giá trị với các giá trị lệ thuộc lẫn nhau 6. Lập bảng giá trị mới rồi tính hiệu số bình phương Var 1 Cova1.2 Cova1.3 Cova1.4 Var 2 Cova2.3 Cova2.4 Var 3 Cova3.4 Var 4 Quần thể Y 1 Y 2 Y 3 Y 4 1 2 D (1-2) hiệu số giữa 1 và 2 D 2 (1-2) hiệu số bình phương giữa 1 và 2 = Σdi 2 Tương tự, chúng ta tính hiệu số bình phương của từng cặp genotypes trong phân tích đa dạng di truyền của quần thể. Thí dụ: D 2 (1-3), D 2 (1-4), D 2 (1-5), D 2 (1-n) D 2 (2-3), D 2 (2-4) , D 2 (2-n) D 2 (10-11) , D 2 (10-n) D 2 ([n-1]-n) 2-3. XẾP NHÓM KIỂU GEN VÀO NHỮNG CLUSTER DI TRUYỀN KHÁC NHAU Căn cứ vào giá trị D 2 , người ta tiến hành xếp nhóm theo trình tự như sau: Phương pháp Tocher: Xếp nhóm giống theo những cluster khác nhau căn cứ vào giá trị D 2 nhỏ nhất ở hàng đầu tiên của tất cả các cột (biểu thị từng giống so với giống còn lại) và mức độ sai biệt có ý nghĩa với giá trị D 2 lớn nhất ở hàng đầu tiên. Chú ý, những giá trị D 2 ở mỗi cột được xếp theo thứ tự từ thấp đến cao. Phương pháp Canonical: Tính toán giá trị tổng bình phương (sum of square), giá trị SS và tổng của các tích (sum of products), giá trị SP, đối với tất cả giá trị Y (gía trị chuyển đổi). Hình thành ma trận chứa các giá trị SS và giá trị SP. Đặt tên ma trận này là [A]. Tính [A] p , trong đó p là số tính trạng mục tiêu được sử dụng để phân nhóm. Thí dụ với 4 tính trạng ta sẽ có [A] 4 . Sau cùng, chúng ta phải tính giá trị Z. 2-4. NGHIÊN CỨU CHUYÊN ĐỀ “Phân tích độ khác biệt di truyền của các giống lúa nướcsâu được sử dụng làm vật liệu lai “ (Bùi chí Bửu 1987) Phân tích độ khác biệt hay độ phong phú về di truyền (divergence analysis) được áp dụng để phân lập các kiểu gen khác nhau, phục vụ cho việc lai tạo giống có hiệu quả mong muốn. Áp dụng phép thử D 2 của Mahalonobis để xếp nhóm các vật liệu khởi đầu theo những tính trạng di truyền số lượng. 2-4-1. Giống được sử dụng làm vật liệu gồm có: 1) Ba bông 2) Ba thiệt 3) Chùm ruột 4) Cù là 5) Chệt cụt 6) Lem lùn 7) Lúa phi 8) Nàng tây đùm 9) Nàng keo 10) Tất nợ 11) Trắng chùm 12) Trắng lùn 13) Trắng phước 14) Trắng tép 15) Nàng tây lớn 2-4-2. Tính trạng mục tiêu: Chiều cao cây, số bông/m 2 và ngày trổ bông có hệ số di truyền rất cao, theo thứ tự (bảng 1) Năng suất có hệ số di truyền thấp, ảnh hưởng ngoại cảnh có tác động khá lớn, phương sai do môi trường (0.27) lớn hơn do kiểu gen. 2-4-3. Phân tích sự đóng góp của các tính trạng có ảnh hưởng đối với độ khác biệt về di truyền cho thấy: hiệu số khác biệt cao nhất xuất hiện ở tính trạng số bông/m 2 và chiều cao cây. Tỉ lệ đóng góp của mỗi yếu tố nầy là 38.09%. Ngày trổ bông có tỷ lệ thấp hơn (18.09%) và năng suất lúa mùa có ảnh hưởng thấp nhất (5.63%). Do đó, đối với lúa nước sâu, lúa nổi, yếu tố chiều cao cây và số bông/m 2 trong điều kiện ngập sâu có vai trò quan trọng về di truyền. 5-4. Áp dụng phương pháp xếp nhóm của Tocher và phương pháp phân tích Mahalomobis- D 2 , có 4 nhóm khác nhau về di truyền là: Nhóm I Nhóm II Nhóm III Nhóm IV Ba bông Lem lùn Ba thiệt Cù là Chệt cụt Lúa phi Chùm ruột Nàng tây đùm Trắng chùm Nàng keo Trắng lùn Tất nợ Trắng tép Nàng tây lớn Trắng phước 2-4-4. Khoảng cách di truyền giữa nhóm và trong nhóm được trình bày ở hinh 12, bảng 20. Khoảng cách I và III, II và IV, III và IV khá lớn. Các genotypes ở trong cùng một nhóm ít khác biệt hơn ở kiểu gen ở nhóm khác. Hệ số D trong nhóm nhỏ hơn rất nhiều so với hệ số D giữa các nhóm. Người ta thường đề cập đến 3 đặc điểm quan trọng trong khi chọn lựa các genotype là (Singh và Chaudhary 1985): Bảng 1: Phương sai và hệ số di truyền của các tính trạng. Ngày trổ bông Cao cây Bông/m 2 Năng suất 2 g σ 276.95 643.39 518.31 0.22 2 e σ 45.45 36.78 50.06 0.27 2 p σ 322.40 680.17 638.37 0.49 h 2 0.8590 0.9459 0.9216 0.4489 2 g σ = phương sai do kiểu gen 2 e σ = phương sai do môi trường 2 p σ = phương sai do kiểu hình h 2 = hệ số di truyền Bảng 2: Giá trị khoảng cách di truyền "D" trong nhóm và giữa các nhóm. Nhóm I II II IV I 4.21 7.12 9.14 7.23 II 2.95 9.00 12.58 III 0.13 14.91 IV 0.00 Hình 2-1: Khoảng cách di truyền giữa các nhóm IV III I II - Chọn nhóm genotype được dùng làm bố mẹ - Chọn các genotype ở trong nhóm có khoảng cách di truyền với nhóm khác càng xa càng tốt. - Chú ý tính trạng có mức độ đóng góp cao nhất về độ khác biệt di truyền (ở đây số bông/m 2 và chiều cao cây có ảnh hưởng mạnh mẽ nhất). Khoảng cách di truyền giữa nhóm III và IV lớn nhất cho thấy sự khác biệt tối đa về di truyền. Trong trường hợp như vậy, kết quả lai tạo sẽ thành công để có những phân ly mạnh mẽ ở các dòng con lai, rất có lợi cho nhà chọn giống để khai thác các biến dị này. Tuy nhiên các tính trạng quan trọng khác như kháng sâu bệnh, phẩm chất hạt cần được lưu ý khi chọn vật liệu làm bố mẹ. Bước kế tiếp nên chọn 1 giống từ mỗi nhóm, tiến hành lai vòng (diallel cross) và phân tích khả năng phối hợp, kết quả đạt được sẽ cao hơn (Singh và Chaudhary 1985). Kết quả phân tích độ khác biệt về di truyền cho thấy: phần lớn các giống được xếp cùng một nhóm có xuất xứ về địa lý giống nhau. Thí dụ như nhóm I tập hợp các giống lúa nổi ở vùng 5, trừ hai giống Nàng keo và Tất nợ. Nhóm II tập hợp các giống ở vùng 4. Nhóm III tập hợp các giống ở vùng 2. Nhóm IV là giống mùa sớm Cù là. Phương pháp phân tích này chỉ là bước đầu tiên để phân lập các kiểu gen khác nhau. Phải tiếp tục thực hiện việc lai thử nghiệm, mới có kết luận cụ thể về ưu thế lai giữa hai nhóm có khoảng cách xa, cũng như sự phân ly mạnh mẽ ở các dòng con lai. 2-5. PHÂN TÍCH NHÓM TRÊN CƠ SỞ ĐIỆN DI VÀ BIỂU HIỆN ĐA HÌNH Với sự phát triển của sinh học phân tử, người ta có xu hướng phân nhóm đa dạng di truyền ở mức độ phân tử. Như vậy, sự chính xác sẽ cao hơn rất nhiều so với phương pháp truyền thống dựa trên tính trạng hình thái học. Người ta khai thác những khả năng phân tích rất nhanh nhạy của máy tính (computer) với nhiều phần mềm chuyên dùng, trong đó NTSYS là phần mềm tương đối khá phổ biến. Theo nội dung này, chúng ta cho điểm 1 khi có băng thể hiện, và điểm 0 khi băng không thể hiện trong điện di. 2-5-1. Phân tích ma trận tương đồng, ma trận khoảng cách (similarity / distance matrix) Các giá trị tương đồng và khoảng cách là những giá trị ước đoán về mặt số lượng nhằm mô tả sự gần gủi và khoảng cách di truyền giữa hai cặp đơn vị mục triêu. Giá trị tương đồng biến thiên từ 0 đến 1. Khoảng cách giảm khi giá trị tương đồng tăng. Khoảng cách (distances) còn được dùng với thuật ngữ “dissimilarities” Sokal và Sneath (1963) mô tả nhiều cách tính toán khoảng cách và mức độ giống nhau giữa hai đơn vị mục tiêu. Khi giá trị ở dạng nhị phân (binary), nghĩa là 1 (có) và 0 (không có), chúng ta đưa chúng về bảng hai chiều như sau Isolate j m = a + d u = b + c n = m + u Trong đó, m là số dữ liệu tương ứng, u là số dữ liệu không tương ứng, u là tổng số băng ghi nhận được a b c d Isolate i 1 0 1 0 Chỉ số tương ứng giản đơn (simple matching coefficient) m S SM = n Ở đây, người ta gọi “negative matches” khi nào cả hai “isolates” i và j đều không thể hiện băng, không đếm được Chỉ số Jaccard (Jaccard’s coefficient) Khi đo mức độ giống nhau không có tình trạng “negative matches”, người ta áp dụng công thức sau đây để có chỉ số Jaccard a S j = a + u Chỉ số Dice (Dice’s coefficient) Một chỉ số khác mô tả mức độ giống nhau bao gồm trường hợp có “negative matches”, đó là chỉ số Dice 2a S b = 2a + u Khi đề cập đến thành phần các băng thể hiện trong điện di, chỉ số Dice có thể được viết lại thành công thức như sau 2a S b = n i + n j Trong đó, n i là số băng của “isolate i”, và n j là số băng của “isolate j” Giá trị khoảng cách Giá trị khoảng cách là độ lệch của những chỉ số biểu thị mức độ giống nhau. Chỉ số tương đồng S (similarity) biến thiến từ 0 đến 1 có thể được chuyển đổi thành giá trị d (distance) theo công thức d = 1 - S Chúng ta có thể tính toán bằng tay để chuyển đổi chỉ số Dice thành chỉ số khoảng cách, nhưng với phần mềm chuyên dùng NTSYS, chúng ta sẽ dễ dàng hơn rất nhiều để có kết qủa với nhiều cặp đơn vị mục tiêu. 2-5-2. Cách tính bằng tay Đếm số băng của isolate 1 và isolate 2 với ký hiệu n 1 và n 2 , theo thứ tự Đếm số băng trùng nhau của isolate 1 và isolate 2, ký hiệu là a 12 Tính chỉ số Dice theo công thức 2 a 12 S b = n 1 + n 2 Chuyển đổi thành giá trị khoảng cách bằng cách lấy 1 trừ đi S D d D = 1 -S D Lập lại qui trình nói trên với những cặp isolate còn lại, thí dụ 1 và 3, 1 và 4, 2 và 3, 2 và 4, v.v 2-5-3. Xếp nhóm bằng phương pháp UPGMA Phân tích nhóm (cluster analysis) thực sự là phương pháp sắp xếp các giống thành những cụm nhóm khác nhau trên cơ sở mức độ giống nhau theo qui ước (người ta còn gọi với thuật ngữ agglomerative clustering). Nó được thực hiện theo qui trình tiêu chuẩn, nên người ta còn gọi đó là “greedy algorithm”. Qui trình theo cácbướctiến hành như sau: • Tìm các cặp (i, j) có giá trị khoảng cách nhỏ nhất (hoặc giống nhau nhất) • Nhập các cặp này lại thành một nhóm (cluster) • Tạo ra nhóm lớn hơn tương ứng với nhóm mới sao cho các cặp (i, j) mới tương thích với giá trị mức độ giống nhau • Lập lại qui trình Một trong những phương pháp đơn giản nhất là phương pháp tính khoảng cách trung bình với giá trị số đại số UPGMA (được viết tắt từ chữ unweighted pair-group method with arithmetic mean) Cách tính bằng tay • Tìm giá trị khoảng cách nhỏ nhất trong ma trận khoảng cách • Xếp nhóm 2 isolate này lại với nhau, theo giá trị khoảng cách cụ thể, ghi giữa hai điểm • Xây dựng ma trận khoảng cách mới phối hợp giữa hai isolate gần nhất trong một nhóm riêng. Khoảng cách giữa hai nhóm mới này và một isolate khác sẽ được ghi nhận với giá trị khoảng cách trung bình của isolate mới với những isolate trong cluster • Lập lại qui trình cho đến hết Thí dụ: ma trận khoảng cách có 5 isolate Isolate 1 2 3 4 2 d 12 3 d 13 d 23 4 d 14 d 24 d 34 5 d 15 d 25 d 35 d 45 Trong đó, d ij là khoảng cách giữa isolate i và isolate j Thí dụ khoảng khoảng giữa isolate 3 và 4 (d 34 ) là ngắn nhất. Hai isolate này được xếp vào một nhóm với khoảng cách điểm nhánh là (d 34 /2) d 34 / 2 d 34 / 2 Ma trận khoảng cách mới trên cơ sở nhóm (3, 4) và những isolate khác Isolate 1 2 (3, 4) 2 d 12 (3, 4) d 1(3,4) d 2(3, 4) 5 d 15 d 25 d 5(3, 4) 3 4 [...]... d1(3,4) = 2 d23 + d34 d2(3,4) = 2 d35 + d45 d5(3,4) = 2 Trong ma tr n m i, tìm giá tr kho ng cách nh nh t Thí d 2) ư c hình thành d 12 / 2 ây là d 12, như v y có nhóm (1, 1 2 d 12 / 2 Như v y, có thêm m t ma tr n kho ng cách m i Isolate (3, 4) 5 (1, 2) d( 12) (34) d( 12) 5 (3, 4) d(34)5 d5( 12) ư c tính toán gi ng như trên, trong khi ó d( 12) (34) ư c tính toán b ng cách l y trung bình c a d1(34) và d2(34): d1(34)... d2(34): d1(34) + d2(34) d( 12) (34) = -2 Trong khi c giá tr kho ng cách c a ma tr n m i, thí d chúng ta ghi nh n d( 12) (34) có kho ng cách ng n nh t i u này có nghĩa là hai nhóm (1, 2) và (3, 4) n m cùng trong nhóm ((1, 2) , (3, 4)) v i kho ng cách : d( 12) (34) 2 d 12 / 2 1 2 d 12 / 2 d34 / 2 3 4 d34/ 2 d( 12) (34) / 2 Ma tr n m i ư c tính toán b ng cách l y trung bình c a d5( 12) và d5(34) Isolate... trung bình c a d5( 12) và d5(34) Isolate 5 Giá tr kho ng cách d5((1, 2) , (3, 4)) = [ d5( 12) + d5(34) ] / 2 ((1, 2) , (3, 4)) d5((1, 2) , (3, 4)) Cu i cùng, chúng ta có gi n phân 5 nhóm như sau 1 2 3 4 5 d5((1, 2) , (3, 4)) / 2 Bi n thiên trong qu n th có th ư c nh tính b ng hi n tư ng d h p ho c hi n tư ng a d ng di truy n, trong ó a d ng di truy n tưong thích v i qu n th c n giao hơn Phương sai c a nh ng... loci khác nhau (Weir 1996) 2- 5-4 Phân tích thông qua chương trình NTSYS-pc trên computer NTSYS-pc là chương trình ph n m m do Rohlf (19 92) thi t k dùng tìm ki m và thành l p ki n trúc nh ng d li u có nhi u bi n NTSYS có th ư c thao tác v i nhi u lo i hình phân tích m t cách linh ng T o file NTSYS Nh m t o ra thao tác trong phân tích nhóm v i d li u thu th p t k t q a m băng i n di, ngư i ta ph i t o ra... u có tính ch t ch n l a tùy thích Matrix parameter line Ma tr n ch a thông s ư c vi t theo hàng, hàng này ch a 4-5 s (2 trong chúng là m t “suffix L”) Dãy s ư c cách nhau m t kho ng tr ng S h ng u tiên là m t mã s c a ma tr n theo cách bi u hi n như sau: 1 = ma tr n có d ng ch nh t 2 = ma tr n vuông s li u không i x ng 3 = ma tr n vuông s li u i x ng 5 = ma tr n có d ng cây, s li u không i x ng 6 =... t sau nh ng s c a hàng ho c c t Thông thư ng ký hi u hàng ư c ưu tiên trư c và c t ư c ký hi u sau Ký hi u c t ph i ư c b t u t m t hàng m i Ký hi u ánh d u b o g m m t dãy ch s (có th hơn 8 ch s ho c digits nhưng không ư c ch a kho ng tr ng) . Cộng A- aa Cộng AA p 2 p 2 q p 2 A- p(1 + pq) pq 2 p 2 + 2pq Aa p 2 q pq pq 2 2pq aa pq 2 q 3 q 2 Aa p q 2 q 3 q 2 Cộng q 2 2pq q 2 1.00 Cộng p 2 + 2pq q 2 1.00 Khi A trội. tích đa dạng di truyền của quần thể. Thí dụ: D 2 (1-3), D 2 (1-4), D 2 (1-5), D 2 (1-n) D 2 (2- 3), D 2 (2- 4) , D 2 (2- n) D 2 (10-11) , D 2 (10-n) D 2 ([n-1]-n) 2- 3. XẾP NHÓM. Cova1.3 Cova1.4 Var 2 Cova2.3 Cova2.4 Var 3 Cova3.4 Var 4 Quần thể Y 1 Y 2 Y 3 Y 4 1 2 D (1 -2) hiệu số giữa 1 và 2 D 2 (1 -2) hiệu số bình phương giữa 1 và 2 = di 2 Tương tự, chúng