ĐỒ ÁN MÔN HỌC CÔNG NGHỆ THỰC PHẨM ỨNG DỤNG CỦA THỐNG KÊ BAYESIAN TRONG PHÉP THỬ PHÂN BIỆT

36 1.3K 0
ĐỒ ÁN MÔN HỌC CÔNG NGHỆ THỰC PHẨM ỨNG DỤNG CỦA THỐNG KÊ BAYESIAN TRONG PHÉP THỬ PHÂN BIỆT

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm MUÏC LUÏC MUÏC LUÏC I TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN [1] [3] Sơ lược đánh giá cảm quan Phép thử phân biệt .3 II TOÅNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [2] [9] [10] [11] 1.Nguồn gốc Noäi dung Ý nghóa Ứng dụng .8 III CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ PHÂN BIỆT [1] [2] [4] .8 Nguyên tắc chung Hình III.1.1: Minh họa đường cong phân phối giả thiết H0 H theo nguyên tắc xử lý số liệu phép thử phân biệt 10 Các phương pháp xử lý số liệu phép thử phân biệt .10 Nếu giả thiết H0 (Hai sản phẩm không khác tính chất cảm quan), gọi xác suất người thử trả lời phép thử p Ta có phép thử: 12 2.2.2 Ý nghóa 13 2.3.1 Noäi dung 13 2.3.2 Ý nghóa 14 Nhaän xeùt 14 IV CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [6] 15 Phương pháp xử lý số liệu theo thống kê Bayesian 15 Khác với phương pháp nêu xem xác suất đưa câu trả lời người thử hay tỉ lệ trả lời (ký hiệu p) số chưa biết, thống kê Bayesian xem tham số p chưa biết biến ngẫu nhiên tuân theo phân phối beta (Beta distribution) 15 1.2.1 Xác định phân phối tiên nghiệm tham số tỉ lệ p 16 1.2.2 Xác định phân phối hậu nghiệm tham số tỉ lệ p 17 1.2.4 Kiểm định giả thiết giả thiết H: (pH) theo kiện thực tế D: (n,x) phương pháp thống kê Bayesian .18 Các ví dụ 19 Hình IV.2.1: Đường cong phân phối beta tiên nghiệm hậu nghiệm 20 Hình IV.2.2: Đường cong phân phối beta tiên nghiệm hậu nghiệm 22 Kiểm định giả thiết H(pH = 0,6) theo kiện thực tế D(n, x): 22 2.3.1 Tham số p có thông tin tiên nghiệm 23 Hình IV.2.3: Đường cong phân phối beta tiên nghiệm hậu nghiệm 24 Kiểm định giả thiết H theo kiện thực tế D(n, x): 24 2.3.2 Tham soá p ban đầu tuân theo phân phối 25 Kiểm định giả thiết H(pH = 0,6) theo kiện thực tế D(n, x): 26 SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm 2.3.3 Khảo sát ảnh hưởng kích thước mẫu thông tin tiên nghiệm đến kết sau 26 Các yếu tố ảnh hưởng đến kết phương pháp kiểm định Bayesian 29 So sánh kết thí nghiệm phương pháp kiểm định giả thiết thống kê cổ điển với phương pháp thống kê Bayesian 30 V SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ CỔ ĐIỂN 31 VI KẾT LUẬN 32 PHUÏ LUÏC .33 TÀI LIỆU THAM KHẢO 36 SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm I TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN [1] [3] Sơ lược đánh giá cảm quan 1.1 Định nghóa “Đánh giá cảm quan phương pháp khoa học sử dụng để gợi lên, đo đạc, phân tích giải thích cảm giác sản phẩm vốn nhận biết thông qua giác quan: thị giác, khứu giác, xúc giác, vị giác thính giác.” (Stone & Sidel – ASTM) 1.2 Các phương pháp đánh giá cảm quan Nhìn chung, tất phương pháp dựa phép xử lý thống kê thông tin thu thập từ người thử Mỗi phép thử tập hợp đánh giá riêng lẻ người tham gia, xếp theo phương thức định trước phù hợp với phép toán thống kê  Phép thử phân biệt: Tìm hiểu xem sản phẩm giống hay khác  Phép thử mô tả: Tìm hiểu xem cường độ tính chất cảm quan  Phép thử thị hiếu: Tìm hiểu xem sản phẩm có ưa thích không, loại sản phẩm hay tính chất cảm quan ưa thích 1.3 Các nguyên tắc đánh giá cảm quan  Sự vô danh mẫu đánh giá: Người thử không bị ảnh hưởng thông tin sản phẩm ngoại trừ tính chất cảm quan  Sự độc lập câu trả lời: Ý kiến người thử độc lập với  Kiểm soát điều kiện thí nghiệm: Các điều kiện thí nghiệm khác cho kết thí nghiệm khác Các thí nghiệm cảm quan phải thực phòng thí nghiệm cảm quan, không thực phân xưởng sản xuất hay nhà máy 1.4 Vai trò đánh giá cảm quan Đánh giá cảm quan cho phép giải bận tâm nhà sản xuất thực phẩm trình kiểm tra nguyên liệu, trình sản xuất, đánh giá ảnh hưởng yếu tố công nghệ kỹ thuật đến sản phẩm cuối cùng, xác định mối quan hệ bao bì chất lượng, xác định thời gian sống sản phẩm cuối phát triển sản phẩm Phép thử phân biệt 2.1 Mục đích Tìm hiểu xem liệu nhóm người thử có thực nhận sai khác sản phẩm câu trả lời cách ngẫu nhiên 2.2 Các phép thử phân biệt 2.2.1 Phép thử A – nonA phép thử hai – ba (Duo – Trio) SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm  Mục đích: Xác định liệu sản phẩm có giống với mẫu chuẩn hay không Phép thử thích hợp tình muốn kiểm tra xem sản phẩm làm có giống với sản phẩm bán thị trường hay không  Nguyên tắc: • A - nonA: Đầu tiên người thử học cách nhận biết mẫu kiểm chứng A Tiếp theo người thử thử dãy mẫu mã hóa bao gồm mẫu A notA, sau người thử phải xác định mẫu A notA Trình bày mẫu: Cân trật tự trình bày mẫu nhóm người thử, số mẫu A notA người thử đánh giá • Hai - ba (Duo - Trio): Đầu tiên người thử học cách nhận biết mẫu kiểm chứng R Tiếp theo người thử thử hai mẫu khác cho biết hai mẫu giống với mẫu R, người thử phải tìm mẫu giống với mẫu R Trình bày mẫu: tổ hợp R(A)AB, R(A)BA, R(B)AB, R(B)BA, số lần xuất tổ hợp cho nhóm người thử 2.2.2 Phép thử giống – khác phép thử tam giác  Mục đích: Xác định khác hai sản phẩm mà không cần biết chất khác Phép thử sử dụng trường hợp khác hai sản phẩm tương đối nhỏ  Nguyên tắc: • Giống - khác: Có hai mẫu thử giới thiệu, người thử phải xác định hai mẫu giống hay khác Trình bày mẫu: tổ hợp AA, BB, AB, BA, số lần xuất tổ hợp cho nhóm người thử • Tam giác: Có ba mẫu thử giới thiệu, hai mẫu giống (được chuẩn bị từ loại sản phẩm), mẫu thứ ba giả định khác hai mẫu lại chuẩn bị từ loại sản phẩm khác, người thử phải xác định mẫu không lặp lại số ba mẫu thử (mẫu khác với hai mẫu lại) Trình bày mẫu: tổ hợp AAB, ABA, ABB, BAB, BBA, BAA, số lần xuất tổ hợp cho nhóm người thử 2.2.3 Phép thử 2-AFC (cặp đôi) 3-AFC  Mục đích: Xác định khác hai sản phẩm tính chất cảm quan xác định  Nguyên tắc: • 2-AFC (cặp đôi): Có hai mẫu thử giới thiệu, người thử phải xác định mẫu có cường độ cảm giác tiêu cụ thể lớn bé mẫu lại SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Trình bày mẫu: tổ hợp AB, BA, số lần xuất tổ hợp cho nhóm người thử • 3-AFC: Có ba mẫu thử giới thiệu, người thử phải xác định mẫu có cường độ cảm giác tiêu cụ thể lớn bé hai mẫu lại Trình bày mẫu: hai nhóm (AAB, ABA, BAA) (ABB, BAB, BBA), phép thử có hai nhóm (mỗi nhóm gồm tổ hợp hai mẫu) giới thiệu, số lần xuất tổ hợp cho nhóm người thử 2.3 Nhóm người đánh giá cảm quan (người thử) • • Thường người tiêu dùng bình thường qua sử dụng sản phẩm Số lượng: Thường nhiều 50 người 2.4 Ứng dụng Giúp cho việc giải vấn đề: • Liệu thay đổi nguyên liệu phận dây chuyền sản xuất mà không dẫn tới thay đổi tính chất cảm quan nhận thấy sản phẩm • Ảnh hưởng bao bì đến mùi vị sản phẩm • Tuổi thọ sản phẩm bao lâu, sản phẩm có bị biến đổi chất lượng trình bảo quản • Bắt chước sản phẩm cạnh tranh • Đánh giá định lựa chọn phương thức công nghệ • Định hướng cho phép thử cảm quan thị hiếu • Tuyển chọn huấn luyện hội đồng cho đánh giá cảm quan II TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [2] [9] [10] [11] 1.Nguồn gốc Phương pháp thống kê Bayesian gọi Lý thuyết Bayes (Bayes’s Theory) hay Suy luận Bayes (Bayesian Inference) đặt theo tên nhà toán học Anh Reverend Thomas Bayes (1702 – 1761) Người bạn ông, Richard Price, chỉnh sửa giới thiệu công trình năm 1763 sau Bayes với tựa đề “An Essay towards solving a Problem in the Doctrine of Chances” Sau đó, Pierre - Simon Laplace mở rộng kết luận năm 1774 Nội dung phương pháp thống kê Bayesian Định lý Bayes (Bayes’s Theorem) Nội dung 2.1 Các khái niệm  Mỗi kết “phép thử” (test) gọi “sự kiện” (survival)  Sự kiện chia thành loại sau: SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Sự kiện trống (sự kiện có): kiện không xảy thực phép thử, ký hiệu Φ • Sự kiện chắn: kiện xảy thực phép thử, ký hiệu Ω • Sự kiện ngẫu nhiên: kiện xảy không xảy tùy thuộc vào phép thử Hai kiện A B gọi “xung khắc” A.B = Φ Các kiện A1, A2, … , An gọi “đôi xung khắc” hai kiện khác xung khắc, tức là: Ai.Aj = Φ với i ≠ j Các kiện A1, A2, … , An gọi “một nhóm đầy đủ kiện” chúng đôi xung khắc chúng chắn xảy ra, tức là: Ai.Aj = Φ với i ≠ j A1 + A2 + … + An = Ω Hai kiện A B gọi “độc lập” xác suất (probability) kiện không phụ thuộc vào xảy hay không xảy kiện •     2.2 Định lý Bayes  Cho hai kiện ngẫu nhiên A B Ta gọi xác suất kiện A kiện B xảy “xác suất A với điều kiện B” hay “xác suất A có B”, ký hiệu P(A/B) Đại lượng gọi “xác suất có điều kiện ” (conditional probability) hay “xác suất hậu nghiệm” (posterier probability) rút từ giá trị cho trước B Theo định lí Bayes, xác suất xảy A biết B phụ thuộc vào yếu tố: • Xác suất xảy A riêng nó, không quan tâm đến B, ký hiệu P(A) đọc “xác suất A” Đây gọi “xác suất biên duyên” hay “xác suất tiên nghiệm” (prior probability), “tiên nghiệm” theo nghóa không quan tâm đến thông tin B • Xác suất xảy B riêng nó, không quan tâm đến A Kí hiệu P(B) đọc “xác suất B” • Xác suất xảy B biết A xảy Kí hiệu P(B/A) đọc “xác suất B có A” Đại lượng gọi “xác suất có điều kiện” (conditional probability) hay “xác suất hậu nghiệm” (posterier probability) rút từ giá trị cho A Từ ta thu công thức sau đây: P ( AB) • Công thức xác suất có điều kiện: P ( A / B) = (CT II.2.1) P ( B) • • Với P(AB) = P(A/B).P(B) = P(B/A).P(A) (CT II.2.2) Công thức xác suất đầy đủ: Cho A1, A2, … , An nhóm đầy đủ kiện Với kiện B ta có: P(B) = P(A1).P(B/A1) + P(A2).P(B/A2) + … + P(An).P(B/An) (CT II.2.3) Công thức Bayes: P ( B / A).P ( A) Dạng đơn giản: P ( A / B) = (CT II.2.4) P ( B) Dạng tổng quát: Với k (k = đến n), ta có: SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng P ( Ak / B ) = ĐAMH Công nghệ Thực phẩm P ( B / Ak ).P ( Ak ) P ( B / Ak ).P ( Ak ) = n P ( B) ∑ P( Ai ).P(B / Ai ) (CT II.2.5) i =1  Tương tự, thực tế ta đặt: • H: Giả thiết (hypothesis) suy luận cần kiểm chứng thực tế • D hay E: Dữ kiện (data) hay chứng (evidence) thu cách thực phép thử, dùng để kiểm định giả thiết H • P(H) gọi “xác suất tiên nghiệm” (prior probability) H • P(D/H) hay P(E/H) gọi “xác suất có điều kiện” (conditional probability) việc quan sát thấy kiện D hay chứng E biết giả thiết H • P(D) hay P(E) gọi “xác suất D hay E”: xác suất việc chứng kiến kiện D hay chứng E tất giả thiết loại trừ đôi (một nhóm đầy đủ giả thiết) • P(H/D) hay P(H/E) gọi “xác suất hậu nghiệm” (posterior probability) H biết D hay E Từ ta thu công thức: • Công thức Bayes nhằm điều chỉnh xác suất giả thiết theo kiện hay chứng mới: P(D / H )P(H ) P(D / H )P(H ) P(H / D) = = (CT II.2.6) P(D) P ( H ).P ( D / H ) + P (notH ).P ( D / notH ) • Với kiện “độc lập” D1 D2 (xác suất kiện không phụ thuộc vào xảy hay không xảy kiện kia), ta áp dụng suy luận Bayes lặp lặp lại Ta dùng kiện thứ để tính xác suất hậu nghiệm ban đầu, dùng xác suất hậu nghiệm làm xác suất tiên nghiệm để tính xác suất hậu nghiệm thứ hai theo kiện thứ hai Tính độc lập kiện thể qua: P(D1, D2) = P(D1).P(D2) P(D1, D2/H) = P(D1/H).P(D2/H) P(D1, D2/notH) = P(D1/notH).P(D2/notH) Định lý Bayes sử dụng lặp lặp lại hàm ý rằng: P ( D1 / H ).P ( D2 / H ) P ( H ) P ( H / D1 , D2 ) = P ( D1 ).P ( D2 )  Ví dụ: Tỉ lệ người nghiện thuốc vùng 30% Tỉ lệ người bị viêm họng số người nghiện 60%, tỉ lệ người bị viêm họng số người không nghiện 40% Lấy ngẫu nhiên người thấy người bị viêm họng Tính xác suất người ngiện thuốc  Giải: Gọi H: kiện nghiện thuốc notH: kiện không nghiện thuốc D: kiện viêm họng SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Ta có: P(H) = 0,3; P(notH) = 0,7; P(DH) = 0,6; P(DnotH) = 0,4 Suy xác suất người viêm họng bị nghiện thuốc: (CT II.2.6) P(D / H )P(H ) 0,6 × 0,3 P(H / D) = = = 0,3913 P ( H ).P ( D / H ) + P ( notH ).P ( D / notH ) 0,3 × 0,6 + 0,7 × 0,4 Ý nghóa Suy luận Bayes sử dụng ước lượng số mức độ tin tưởng vào giả thiết trước quan sát kiện hay chứng, tính toán ước lượng số mức độ tin tưởng vào giả thiết sau quan sát chứng Trong phương pháp thống kê Bayes, việc thu thập kiện hay chứng quán không quán với giả thiết Trong trình thu thập tích lũy chứng, mức độ tin tưởng vào giả thiết thay đổi Khi có đủ chứng, mức độ tin tưởng thường trở nên cao thấp Do đó, theo lý thuyết, coi sở logic thích hợp cho việc chọn lọc giả thiết mâu thuẫn nhau: giả thiết với mức độ tin tưởng cao nên chấp nhận đúng, giả thiết với độ tin tưởng thấp nên bị coi sai loại bỏ Các nhà thống kê Bayes lập luận người ta có xác suất chủ quan tiên nghiệm khác nhau, chứng từ quan sát lặp lặp lại có xu hướng đưa xác suất hậu nghiệm họ lại gần Trong công thức Bayes, tỉ số P(D/H) / P(D) đại diện cho ảnh hưởng kiện hay chứng mức độ tin tưởng vào giả thiết Nếu có khả quan sát chứng giả thiết xét đúng, tỉ số có giá trị lớn Khi nhân “xác suất tiên nghiệm” giả thiết với tỉ số này, ta xác suất hậu nghiệm lớn giả thiết có chứng Nhờ đó, suy luận Bayes, định lý Bayes đo mức độ mà kiện hay chứng làm thay đổi tin tưởng vào giả thiết Ứng dụng Phương pháp thống kê Bayesian ứng dụng rộng rãi nhiều lónh vực khác như: • Trong quản lý dựa án, xây dựng: Dự báo, đánh giá rủi ro tiến độ, kinh phí, chất lượng, tai nạn lao động… • Trong y học: Kiểm tra hiệu thuốc ảnh hưởng đối tượng khác nhau, dự đoán tỉ lệ người mắc loại bệnh đó, … • Trong đánh giá cảm quan v.v… III CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ PHÂN BIỆT [1] [2] [4] Nguyên tắc chung  Nguyên tắc xử lý số liệu phép thử phân biệt thường tiến hành theo bước sau: • Đề giả thiết H: “Hai sản phẩm khác tính chất cảm quan” SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm (Giả thiết mà tin thật muốn chứng minh kiện) • Từ giả thiết đề giả thiết đảo H 0: “Hai sản phẩm không khác tính chất cảm quan” • Chọn mức xác suất (probability level) hay mức ý nghóa (significance level) α (thường phía) cho sai lầm loại (bác bỏ H 0, công nhận H H0 đúng) Chọn rủi ro beta β (beta risk) độ tin cậy / lực kiểm định (power) – β cho sai lầm loại (công nhận H0, bác bỏ H H0 sai) cần (hai sản phẩm dự đoán không khác tính chất cảm quan) • Chọn độ lớn hiệu ứng d – khác biệt H H mà muốn phát (ví dụ chênh lệch tỉ lệ trả lời đúng) • Chọn kích thước mẫu n theo α, β, d để đảm bảo xác suất tối đa cho phép mắc sai lầm loại α xác suất tối đa cho phép mắc sai lầm loại β Hoặc chọn mẫu theo điều kiện sở vật chất cho phép để tiến hành thí nghiệm, phải tính lại d theo α, β, n chọn, tính lại β theo α, d, n chọn cần • Tiến hành thu thập kiện D: Làm thí nghiệm để đánh giá giống hay khác tính chất cảm quan hai sản phẩm • Phân tích kiện: Sử dụng phương pháp thống kê để tính toán xác suất xảy D H0 thật Nói theo ngôn ngữ toán xác suất, bước tính toán trị số P(DH0) hay đại lượng đại diện cho trị số • Ứng với mức ý nghóa α cho trước, kết thu chia thành hai trường hợp:  P(DH0) < α: Nếu giả thiết đảo H0 kiện D xem không xảy (xác suất xảy D H thấp) Nhưng thực tế kiện D xảy ra, nên ta loại bỏ giả thiết đảo H 0, công nhận giả thiết H, nghóa công nhận khác tính chất cảm quan hai sản phẩm “có ý nghóa thống kê” (significant)  P(DH0) ≥ α: Nếu giả thiết đảo H0 kiện D có khả xảy Ta chưa có đủ chứng để bác bỏ giả thiết đảo H công nhận giả thiết H, nghóa chưa thể kết luận hai sản phẩm khác hay giống tính chất cảm quan Để kết luận hai sản phẩm giống nhau, ta phải đánh giá độ rủi ro β hay lực kiểm định (power) - β nêu  Theo Hỡnh III.1.1, ta coự: ã à0 vaứ lan lửụùt trị trung bình giả thiết đảo H0 giaỷ thieỏt chớnh H ã d = à0 độ lớn hiệu ứng, số trường hợp chênh lệch tỉ lệ trả lời mà ta phát ứng với α, β n biết Ta thấy: • Nếu số người hay tỉ lệ trả lời nhỏ giá trị điểm dừng xác suất phạm sai lầm loại tăng lên đưa định có phân biệt (loại bỏ H 0), xác suất phạm sai lầm loại giảm định phân biệt (chấp nhận H0) • Nếu số người hay tỉ lệ trả lời lớn giá trị điểm dừng xác suất phạm sai lầm loại giảm loại bỏ H 0, xác suất phạm sai lầm loại tăng lên chấp nhận H0 SVTH: Nguyễn Ngọc Bảo Trân Trang GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Do đó: • Nếu số người hay tỉ lệ trả lời nhỏ giá trị điểm dừng ta chấp nhận giả thiết H0 rủi ro β nhỏ giá trị chọn ban đầu • Nếu số người hay tỉ lệ trả lời lớn giá trị điểm dừng ta loại bỏ giả thiết H0 rủi ro α nhỏ giá trị chọn ban đầu Điểm dừng Miền chấp nhận Ho β µo Miền loại bỏ Ho d α µ Hình III.1.1: Minh họa đường cong phân phối giả thiết H0 H theo nguyên tắc xử lý số liệu phép thử phân biệt  Mối quan hệ α, β, d n: • Ứng với d n không đổi, vị trí điểm dừng dịch sang trái α tăng, β giảm ngược lại • Ứng với d không đổi, n tăng α, β giảm, độ lệch chuẩn phân phối giảm, phân phối trở nên cao hẹp hơn, khoảng tin cậy chung quanh trị trung bình co lại nên độ xác phép kiểm định tăng • Trong nhiều trường hợp, thí nghiệm thực với mối quan tâm ban đầu α kích thước mẫu n Khi đó, β d có quan hệ đơn điệu, ta quan sát sau thực thí nghiệm để biết kỳ vọng mức độ tin cậy – β ứng với độ lớn khác hiệu ứng Các phương pháp xử lý số liệu phép thử phân biệt 2.1 Kiểm định Khi - bình phương χ 2.1.1 Nội dung  Ta có χ2 quan sát: χ qs = ∑ Với (O − T ) T (CT III.2.1) O: Tần số quan sát T: Tần số lý thuyết tính với giả thiết H (hai sản phẩm không khác tính chất cảm quan) SVTH: Nguyễn Ngọc Bảo Trân Trang 10 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Hình IV.2.2: Đường cong phân phối beta tiên nghiệm hậu nghiệm  Kiểm định giả thiết H(pH = 0,6) theo kiện thực tế D(n, x): Giá trị pH = 0,6 tính dựa vào:  Tỉ lệ người phân biệt pd = 0,2  Xác suất trả lời ngẫu nhiên p0 = 0,5 (phần III.2.2.1) Suy tỉ lệ trả lời ước lượng pH = pc = pd + (1 – pd)p0 = 0,6 (CT III.3.1) Ta có giả thiết H: “Tỉ lệ trả lời p < 0,6” (ứng với tỉ lệ người phân biệt p d < 0,2) kiện D: “Có 81 câu trả lời 150 câu trả lời” Suy ra: • Các xác suất: P(H) = pH = 0,6 vaø P(HD) = P(p < 0,6) = F(0,6) = 0,9339 Vậy xác suất để tỉ lệ trả lời p < 0,6 93,39% hay xác suất 20% người thử thực nhận thấy khác biệt 93,39% • Theo (Carlin Louis, 2000), ta có: 0,9339 /(1 − 0,9339) B= = 9,42 ⇒ 2,2 < 2lnB = 4,5 < 0,6 /(1 − 0,6) Ta nói giả thiết H có chứng xác thực / rõ ràng (positive evidence)  Kết luận: Ta chấp nhận giả thiết H: “Tỉ lệ người phân biệt p d < 0,2” P(p < 0,6) = 93,39% vaø 2lnB = 4,5; nghóa kỳ vọng nhà sản xuất phù hợp với kết thí nghiệm SVTH: Nguyễn Ngọc Bảo Trân Trang 22 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm 2.3 Ví dụ (Jian Bi, 2001) Giả sử có 50 người tham gia phép thử phân biệt 2-AFC không định hướng (nondirectional 2-AFC method) cho hai sản phẩm A B, có 35 người chọn sản phẩm A Gọi p ∈ [0; 1] đại lượng ngẫu nhiên đặc trưng cho xác suất hay tỉ lệ chọn sản phẩm A người thử Ta dùng phương pháp thống kê Bayesian để xử lý kết phép thử trường hợp sau: - Có thông tin tiên nghiệm: trung bình µ = 0,6 phương sai σ2 = 0,01 - Không có thông tin tiên nghiệm, xem p tuân theo phân phối với a = b =1 - Khảo sát ảnh hưởng kích thước mẫu thông tin tiên nghiệm đến đến kết sau thí nghiệm 2.3.1 Tham số p có thông tin tiên nghiệm  Xác định phân phối tiên nghiệm: • Trung bình tiên nghiệm: Theo kinh nghiệm tiên nghiệm (prior experience), tỉ leọ choùn saỷn phaồm A khoaỷng = 0,6 ã Phương sai tiên nghiệm: Theo tác giả, có khả tỉ lệ p nằm khoảng 0,5 đến 0,7, thật đáng ngạc nhiên p > 0,8 có đến hai độ lệch chuẩn (standard deviation) từ trị trung bình 0,6 đến 0,8 Do đó, phương sai có giá trị khoảng σ2 = 0,01 (nghóa độ lệch chuẩn σ = 0,1) • Suy tham số:  0,6(1 − 0,6)   µ (1 − µ )  − 1 = 0,6  − 1 = 13,8  a = µ (CT IV.1.8) 0,01  σ      0,6(1 − 0,6)   µ (1 − µ )  b = (1 − µ )  − 1 = (1 − 0,6)  − 1 = 9,2 (CT IV.1.9) 0,01  σ     Xác định phân phối hậu nghiệm: Biết n = 50 x = 35 • Các tham số: a* = 48,8 b* = 24,2 ã Trung bỡnh à* = 0,6685 Phửụng sai σ2* = 2,9947.10-3 ≈ 0,0030 ⇒ Độ lệch chuẩn σ* = 0,0547  Dựng đường cong phân phối beta tiên nghiệm hậu nghiệm: (phần mềm R)  Xác định khoảng tin cậy (p1, p2) phân phối hậu nghiệm: Chọn α = 0,05 • Theo (Jian Bi, 2001): (p1, p2) = (0,5612; 0,7758) Vậy khoảng tin cậy 95% p theo phân phối hậu nghiệm (0,5612; 0,7758), nghóa 95% tỉ lệ chọn sản phẩm A nằm khoảng (0,5612; 0,7758) • Dùng phần mềm thống kê R: (p1, p2) = (0,5572; 0,7710) Vậy khoảng tin cậy 95% p theo phân phối hậu nghiệm (0,5572; 0,7710), nghóa 95% tỉ lệ chọn sản phẩm A nằm khoảng (0,5572; 0,7710) SVTH: Nguyễn Ngọc Bảo Trân Trang 23 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Hình IV.2.3: Đường cong phân phối beta tiên nghiệm hậu nghiệm  Kiểm định giả thiết H theo kiện thực tế D(n, x): Ta có kiện D: “Có 35 người chọn sản phẩm A tổng số 50 người thử” - Giả thiết H1 (pH = 0,5): “Tỉ lệ chọn sản phẩm A: p > 0,5” Suy ra: • Các xác suất: P(H) = – pH = 0,5 vaø P(HD) = P(p > 0,5) = – F(0,5) = 0,9983 Vậy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 99,83% • Theo (Carlin Louis, 2000), ta có: 0,9983 /(1 − 0,9983) B= = 587,24 ⇒ 2lnB = 12,75 > 0,5 / 0,5 Ta nói giả thiết H1 có chứng chắn / thuyết phục (strong evidence)  Kết luận: Ta chấp nhận giả thiết H 1: “Tỉ lệ chọn sản phẩm A lớn 0,5” P(p > 0,6) = 99,83% 2lnB = 12,75; nghóa hai sản phẩm A B khác Ta thấy khoảng tin cậy 95% p theo phân phối hậu nghiệm là(0,5572; 0,7710) không bao gồm p = 0,5, nên không kiểm định giả thiết H ta kết luận: “Với khoảng tin cậy 95% hai sản phẩm khác nhau” - Giả thiết H2 (pH = 0,6): “Tỉ lệ chọn sản phẩm A: p > 0,6” Suy ra: • Các xác suất: P(H) = – pH = 0,4 vaø P(HD) = P(p > 0,6) = – F(0,6) = 0,8910 Vaäy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 89,10% • Theo (Carlin Louis, 2000), ta coù: 0,8910 /(1 − 0,8910) B= = 12,26 ⇒ 2,2 < 2lnB = 5,01 < 0,4 / 0,6 Ta nói giả thiết H2 có chứng xác thực / rõ ràng (positive evidence) SVTH: Nguyễn Ngọc Bảo Trân Trang 24 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm  Kết luận: Ta chấp nhận giả thiết H 2: “Tỉ lệ chọn sản phẩm A lớn 0,6” P(p > 0,6) = 89,10% vaø 2lnB = 5,01 Ta thấy kiện thực tế D(n, x) = D(50 ; 35) làm thay đổi mức độ tin tưởng vào khả tồn thông tin tiên nghiệm ban đầu với µ = 0,6 σ = 0,1 - Kiểm định tính tương tự theo giới hạn tương tự d’ mô hình Thurstone ([5], trang 117 – 129): • Theo (Ennis, 1993), ta có d’ = ứng với tỉ lệ trả lời p = 0,76 d’ = 0,5 ứng với p = 0,64 Khi d’ = (pH = 0,76) ta coù giả thiết H1: “Tỉ lệ chọn sản phẩm A (trả lời đúng) nhỏ 0,76” Suy ra: P(H) = 0,76 vaø P(HD) = P(p < 0,76) = F(0,76) = 0,9581 Vậy xác suất để tỉ lệ trả lời p > 0,76 95,81%  Kết luận: Với giới hạn tương tự d’ = 1, ta kết luận hai sản phẩm giống với xác suất 95,81% • Khi d’ = 0,5 (pH = 0,64) ta có giả thiết H 2: “Tỉ lệ chọn sản phẩm A (trả lời đúng) nhỏ 0,64” Suy ra: P(H) = 0,64 P(HD) = P(p < 0,64) = F(0,64) = 0,2958 Vậy xác suất để tỉ lệ trả lời p > 0,64 29,58%  Kết luận: Với giới hạn tương tự d’ = 0,5, ta chưa thể kết luận hai sản phẩm giống xác suất để tỉ lệ p < 0,64 thấp, có 29,58% Từ đó, ta thấy việc đưa kết luận tính tương tự hai sản phẩm phụ thuộc vào việc chọn giới hạn tương tự nhà sản xuất hay nghiên cứu Tùy đối tượng tiêu dùng mà chọn giới hạn tương tự d’ phù hợp, ta thấy d’ nhỏ người tiêu dùng chặt chẽ lớn người tiêu dùng dễ dãi 2.3.2 Tham số p ban đầu tuân theo phân phối  Xác định phân phối tiên nghiệm: • Các tham số: a = b =1 • Trung bỡnh tieõn nghieọm: = 0,5 ã Phửụng sai tiên nghiệm: σ2 = 1/12 = 0,0833 ⇒ Độ lệch chuẩn σ = 0,2887  Xác định phân phối hậu nghiệm: Biết n = 50 x = 35 • Các tham số: a* = 36 b* = 16 • Trung bình µ* = 0,6923 Phương sai σ2* = 4,0192.10-3 ≈ 0,0040 ⇒ Độ lệch chuẩn σ* = 0,0634  Dựng đường cong phân phối beta tiên nghiệm hậu nghiệm: (phần mềm R)  Xác định khoảng tin cậy (p1, p2) phân phối hậu nghiệm: Chọn α = 0,05 • Theo (Jian Bi, 2001): (p1, p2) = (0,5681; 0,8166) Vậy khoảng tin cậy 95% p theo phân phối hậu nghiệm (0,5681; 0,8166), nghóa 95% tỉ lệ trả lời nằm khoảng (0,5681; 0,8166) • Dùng phần mềm thống kê R: (p1, p2) = (0,5617; 0,8089) SVTH: Nguyễn Ngọc Bảo Trân Trang 25 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Vậy khoảng tin cậy 95% p theo phân phối hậu nghiệm (0,5617; 0,8089), nghóa 95% tỉ lệ trả lời nằm khoảng (0,5617; 0,8089) Hình IV.2.4: Đường cong phân phối beta tiên nghiệm hậu nghiệm  Kiểm định giả thiết H(pH = 0,6) theo kiện thực tế D(n, x): Giả thiết H (pH = 0,6): “Tỉ lệ chọn sản phẩm A: p > 0,6” Suy ra: • Các xác suất: P(H) = – pH = 0,4 vaø P(HD) = P(p > 0,6) = – F(0,6) = 0,9211 Vậy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 92,11% • Theo (Carlin Louis, 2000), ta có: 0,9211 /(1 − 0,9211) B= = 17,51 ⇒ 2,2 < 2lnB = 5,7 < 0,4 / 0,6 Ta nói giả thiết H có chứng xác thực / rõ ràng (positive evidence)  Kết luận: Ta chấp nhận giả thiết H: “Tỉ lệ chọn sản phẩm A lớn 0,6” P(p > 0,6) = 99,11% vaø 2lnB = 5,7 Ta thấy khoảng tin cậy 95% p theo phân phối hậu nghiệm là(0,5617; 0,8089) không bao gồm p = 0,5, nên ta kết luận: “Với khoảng tin cậy 95% hai sản phẩm khác nhau” 2.3.3 Khảo sát ảnh hưởng kích thước mẫu thông tin tiên nghiệm đến kết sau Khảo sát ảnh hưởng kích thước mẫu (n, x) (50, 35) (500, 350) (gấp 10 lần ban đầu) đến khoảng tin cậy (p 1, p2) phân phối hậu nghiệm Ta thu bảng kết đồ thị sau: SVTH: Nguyễn Ngọc Bảo Trân Trang 26 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Bảng IV.2.1: Ảnh hưởng kích thước mẫu đến phân phối hậu nghiệm µ (a, b) n x σ2 µ* σ 2* (p1, p2) (1; 1) 50 35 0,5 0,0833 0,6923 0,0040 (0,5617; 0,8089) (13,8; 9,2) 50 35 0,6 0,01 0,6685 0,0030 (0,5572; 0,7710) (1; 1) 500 350 0,5 0,0833 0,6992 0,0004 (0,6584; 0,7385) (13,8; 9,2) 500 350 0,6 0,01 0,6956 0,0004 (0,6555; 0,7343) Hình IV.2.5: Các đường cong phân phối hậu nghiệm ứng với n = 50 x = 35 SVTH: Nguyễn Ngọc Bảo Trân Trang 27 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Hình IV.2.6: Các đường cong phân phối hậu nghiệm ứng với n = 500 x = 350  Nhận xét:  Khi kích thước mẫu nhỏ (n = 50, x = 35): Ảnh hưởng thông tin tiên nghiệm rõ rệt, độ chồng chập hai đường cong phân phối hậu nghiệm (ứng với hai thông tin tiên nghiệm khác nhau) không cao lắm, ta hoàn toàn phân biệt hai đường cong đồ thị Mức độ ảnh hưởng thông tin tiên nghiệm phụ thuộc vào tổng hai tham số tiên nghiệm a b • Với a = b = 1: Do tổng a b nhỏ (a + b = 2) nên kết thí nghiệm chủ yếu định kiện thực tế (n, x) = (50; 35), trung bình hậu nghiệm µ* = 0,6923 khoảng tin cậy phân phối hậu nghiệm (p 1; p2) có xu hướng lệch sang phải theo ước lượng kiện thực tế pD = x/n = 0,7 • Với a = 13,8; b = 9,2: Do tổng a b lớn (a + b = 23) nên ảnh hưởng thông tin tiên nghiệm kết thí nghiệm rõ rệt hơn, trung bình hậu nghiệm µ* = 0,6685 khoảng tin cậy phân phối hậu nghiệm (p 1; p2) có xu hướng lệch sang trái so với trường hợp a = b =  Khi kích thước mẫu lớn (n = 500, x = 350): Ảnh hưởng kích thước mẫu định, ảnh hưởng thông tin tiên nghiệm không đáng kể, hai đường cong phân phối hậu nghiệm (ứng với hai thông tin tiên nghiệm khác nhau) gần chồng chập hoàn toàn, ta khó phân biệt hai đường cong đồ thị SVTH: Nguyễn Ngọc Bảo Trân Trang 28 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Các yếu tố ảnh hưởng đến kết phương pháp kiểm định Bayesian Kết kiểm định Bayesian phép thử phân biệt thể qua đại lượng hậu nghiệm a*, b*, µ*, σ*, khoảng tin cậy (p1, p2) xác suất P(HD) Chọn µ* làm đại diện cho đại lượng trên, ta thấy trung bình hậu nghiệm µ* trung bình trọng số tham số tiên nghiệm số liệu mẫu thí nghiệm Ảnh hưởng thông tin tiên nghiệm thể qua tổng (a + b) ảnh hưởng kiện thực tế thể qua kích thước mẫu n Khi tổng (a + b) lớn n nhỏ ảnh hưởng thông tin tiên nghiệm đến kết lớn hơn, khoảng tin cậy (p 1, p2) có xu hướng lệch phía phân phối tiên nghiệm, ngược lại Do hai yếu tố quan trọng nhất, ảnh hưởng định đến kết kiểm định Bayesian thông tin tiên nghiệm kích thước mẫu  Thông tin tiên nghiệm: Đại diện cho kinh nghiệm nghiên cứu trước Nếu thông tin tiên nghiệm đáng tin cậy sử dụng cách hợp lý đóng góp tích cực việc phân tích kết (dữ kiện thực tế) nghiên cứu Việc lựa chọn thông tin tiên nghiệm quan trọng, định đến tính đắn độ tin cậy kết luận sau Chính vậy, trình lựa chọn đòi hỏi cân nhắc hiểu biết định nhà nghiên cứu sản xuất tính chất cảm quan sản phẩm nghiên cứu thử nghiệm  Kích thước mẫu: Đại diện cho kiện thực tế ứng với thời điểm điều kiện thí nghiệm Việc lựa chọn kích thước mẫu quan trọng lựa chọn thông tin tiên nghiệm, đặc biệt trường hợp thông tin tiên nghiệm trở nên lỗi thời không phù hợp với thực tế (tất nhiên lựa chọn thông tin tiên nghiệm khó lường trước hết tính không đắn nó), kích thước mẫu phải đủ lớn để đảm bảo kết đáng tin cậy Tuy nhiên, bỏ qua thông tin tiên nghiệm (xem phân phối tiên nghiệm phân phối đều, ảnh hưởng phân phối lên kết không đáng kể n đủ lớn), mà thí nghiệm lại thực điều kiện tồi (không kiểm soát tốt điều kiện thí nghiệm, điều không mong muốn không dám không xảy ra) kích thước mẫu lớn làm sai lệch nghiêm trọng tính đắn kết thí nghiệm, mặt khác chọn n lớn tốn nhiều thời gian chi phí cho việc tuyển chọn và/hoặc huấn luyện người thử điều kiện sở vật chất không cho phép Bên cạnh cần phải lưu ý rằng: “… suy luận rút từ mẫu liệu chứa mẫu đó… Dù tinh vi đến mức nào, phép phân tích thống kê đưa liệu từ liệu sai.” (O’ Mahony), nói cách khác, điều kiện thời điểm thí nghiệm thay đổi, kiện thực tế thay đổi theo Đó lý phải tham khảo thêm thông tin tiên nghiệm biết cách chọn mẫu hợp lý Ta ước lượng kích thước mẫu phần mềm máy tính để thu khoảng tin cậy (p1, p2) mong muốn cách sử dụng tiêu chuẩn ACC (average coverage criterion) hay HPD (highest posterior density) SVTH: Nguyễn Ngọc Bảo Trân Trang 29 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Ngoài hai yếu tố trên, có yếu tố khác ảnh hưởng đến xác suất hậu nghiệm P(HD), giá trị p0 để kiểm định giả thiết H Như nêu phần IV.1.2.4, giá trị chọn dựa theo mục đích nhà sản xuất hay nghiên cứu – mong muốn sản phẩm giống hay khác mức độ nghiêm khắc hay dễ dãi người tiêu dùng So sánh kết thí nghiệm phương pháp kiểm định giả thiết thống kê cổ điển với phương pháp thống kê Bayesian Ta xét trường hợp sau thống kê cổ điển:  Khi n = 50, x = 35: • Ước lượng điểm (point estimate) xác suất trả lời p: 35/50 = 0,7 • Khoảng tin caọy 95% cuỷa p: Z ì (1 − µ ) / n = 0,7 1,96 ì 0,7(1 0,7) / 50 = à0 (0,5730; 0,8270)  Khi n = 500, x = 350: • Ước lượng điểm p: 350/500 = 0,7 • Khoảng tin cậy 95% p: 0,7 ± 1,96 × 0,7(1 − 0,7) / 500 = (0,6598; 0,7402) Ta thu bảng sau: Bảng IV.4.1: So sánh kết thống kê cổ điển thống kê Bayesian µ (a, b) n x σ2 µ* σ 2* (p1, p2) (1; 1) 50 35 0,5 0,0833 0,6923 0,0040 (0,5617; 0,8089) (13,8; 9,2) 50 35 0,6 0,01 0,6685 0,0030 (0,5572; 0,7710) Thoáng kê cổ điển 50 35 - - 0,7 0,0098 (0,5730; 0,8270) (1; 1) 500 350 0,5 0,0833 0,6992 0,0004 (0,6584; 0,7385) (13,8; 9,2) 500 350 0,6 0,01 0,6956 0,0004 (0,6555; 0,7343) Thống kê cổ điển 500 350 - - 0,7 0,0010 (0,6598; 0,7402)  Nhận xét:  Về kích thước mẫu n: • Khi kích thước mẫu n nhỏ, thông tin tiên nghiệm có nhiều ảnh hưởng đến kết quả, tổng (a + b) lớn Khi kết từ hai phương pháp thống kê cổ điển thống kê Bayesian khác có ý nghóa • Khi kích thước mẫu n đủ lớn thông tin tiên nghiệm có tổng (a + b) nhỏ, kích thước mẫu ảnh hưởng định đến kết Khi đó, kết hai phương pháp không khác  Về thông tin tiên nghiệm Kết phương pháp thống kê cổ điển gần với kết thống kê Bayesian phân phối tiên nghiệm phân phối Nói cách khác, kết thống kê cổ điển xem trường hợp đặc biệt thống kê Bayesian ta bỏ qua thông tin tiên nghiệm SVTH: Nguyễn Ngọc Bảo Trân Trang 30 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm V SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ CỔ ĐIỂN Bảng V.1: So sánh thống kê Bayesian với thống kê cổ điển Đặc điểm Thống kê cổ điển Thống kê Bayesian Phương pháp tính toán Các bước tính toán thực Các bước tính toán thực với điều kiện giả thiết đảo H0 dựa thông tin tiên nghiệm (a, b) kiện thực tế (n, x) Không sử dụng giả thiết đảo H0 Điều kiện ràng buộc Tổng số câu trả lời người Xem tham số p chưa biết biến thử biến ngẫu nhiên nhị phân, ngẫu nhiên tuân theo phân phối beta nghóa là: - Xem xác suất đưa câu trả lời người thử số chưa biết p - Các câu trả lời người thử phải độc lập với Yếu tố ảnh hưởng Mức ý nghóa α, β, độ lớn hiệu Thông tin tiên nghiệm (a + b) kích ứng d, kích thước mẫu n thước mẫu n Kết Thể gián tiếp qua “xác suất xảy Thể trực tiếp qua “xác suất kiện giả thiết xét giả thiết ứng với kiện thu đúng” P(DH0) hay P(DH) được” P(HD) Độ tin cậy (chính xác) Tăng kích thước mẫu n, giảm xác suất mắc sai lầm loại loại (giảm α, β) Không sử dụng thông tin tiên nghiệm Sử dụng xác suất hậu nghiệm tích lũy, kết hợp thông tin tiên nghiệm (từ nghiên cứu trước) với kiện thực tế (ứng với thời điểm điều kiện thí nghiệm tại) Ưu điểm thống kê Bayesian so với thống kê cổ điển điều cần lưu ý:  Ưu điểm: • Kết thống kê Bayesian thể trực tiếp điều mà nhà sản xuất nghiên cứu quan tâm, “xác suất giả thiết H ứng với kiện thực tế P(HD)” • Không bị ràng buộc điều kiện vốn mâu thuẫn với thực tế thống kê cổ điển • Thuận lợi việc kiểm định tương tự hai sản phẩm Khác với thống kê cổ điển, đủ chứng để kết luận “Hai sản phẩm khác tính chất cảm quan”, nghóa P(DH0) ≥ α, ta phải xét thêm rủi ro β trước đưa kết luận sau • Thể tính khách quan, hợp lý thận trọng việc đưa kết luận sau có kết hợp thông tin tiên nghiệm kiện thực tế SVTH: Nguyễn Ngọc Bảo Trân Trang 31 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm  Lưu ý: Kết kiểm định Bayesian thu dựa tảng thông tin tiên nghiệm kiện thực tế, hai yếu tố hoàn toàn thay đổi theo thời gian điều kiện thí nghiệm khác Do nhà sản xuất hay nghiên cứu cần phải có hiểu biết định tính chất cảm quan sản phẩm cân nhắc, thận trọng việc xác định thông tin tiên nghiệm kích thước mẫu VI KẾT LUẬN Đánh giá cảm quan lónh vực đầy thách thức, tất phức tạp đòi hỏi trí tuệ bước phân tích thực phẩm, kỹ thuật thực phẩm hóa học thực phẩm Trong đó, phân biệt trình bản, làm sở cho tất câu trả lời cảm quan Theo (Ennis, 1993), phân biệt hai sản phẩm sở để mô tả khác biệt chúng, khác biệt thị hiếu người tiêu dùng Do đó, phép thử phân biệt có vai trò quan trọng định đánh giá cảm quan thực phẩm Trong nhiều ứng dụng liên quan đến sản phẩm thay đổi trình, đánh giá khác biệt chế phù hợp để trả lời khả thay sản phẩm Mặt khác, phép thử phân biệt tỏ dễ thực đơn giản để đưa định kiến nghị khác biệt sản phẩm Tuy nhiên, phép thử cảm quan khác, công cụ đưa số liệu đánh giá cảm quan người Con người rõ ràng công cụ đo không ổn định khó hiệu chỉnh, họ đặt cho chuyên gia cảm quan nhiều vấn đề đo đạc vốn phép đo công cụ Chính vậy, trình xử lý kết phép thử phân biệt, phương pháp kiểm định giả thiết thống kê cổ điển gặp phải khó khăn mặt phương pháp luận chủ yếu liên quan đến chất tâm sinh lý người Việc đưa giả định “Khả trả lời người thử nhau” rõ ràng mâu thuẫn với tâm lý cá nhân trình cảm nhận đưa định Thực ra, xác suất trả lời người thử không phụ thuộc vào nhiều yếu tố Bên cạnh đó, kết thống kê cổ điển không cung cấp cho nhà sản xuất hay nghiên cứu điều mà họ thật quan tâm, mức độ khả dó giả thiết ứng với kiện thực tế Chính vậy, phương pháp thống kê Bayesian với cách thức lập luận hợp lý ứng dụng xử lý kết phép thử phân biệt nhằm khắc phục khó khăn gặp phải thống kê cổ điển Kết luận thu từ kiểm định Bayesian đơn giản dễ hiểu Tuy nhiên, phương pháp cần có thời gian kiểm nghiệm chấp nhận Mặc dù vậy, thống kê Bayesian hứa hẹn sở hữu nhiều ứng dụng tiềm lónh vực cảm quan Ngay hoàn toàn thay thống kê cổ điển tương lai, thống kê Bayesian sử dụng nhiều lónh vực, đặc biệt lónh vực khoa học xã hội Tóm lại, phương pháp thống kê phần quan trọng nhà khoa học cảm quan Phương pháp thống kê lúc rõ ràng kín kẽ Ngay điều kiện thực nghiệm tốt nhất, có chiều hướng rủi ro đưa định sai Tuy nhiên, phương pháp thống kê tốt giúp giảm thiểu, kiểm soát ước lượng rủi ro SVTH: Nguyễn Ngọc Bảo Trân Trang 32 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm PHỤ LỤC Các lệnh cần dùng phần mềm thống kê R Phân phối nhị phân Giả sử thực phép thử thu n câu trả lời có k câu trả lời đúng, biết p xác suất đưa câu trả lời X đại lượng ngẫu nhiên đặt trưng cho số câu trả lời người thử Ta tính xác suất tích lũy: • P(X ≤ k) → pbinom(k, n, p) • P(X ≥ k) → – pbinom(k – 1, n, p) Phân phối beta Gọi     a > b > hai tham số phân phối beta p ∈ [0; 1] đại lượng ngẫu nhiên đặc trưng cho tỉ lệ trả lời pH ∈ [0; 1] tỉ lệ trả lời dùng để so sánh tính toán Ta có: Hàm mật độ xác suất: f(pH) → dbeta(pH, a, b) Xác suất tích lũy: • P(p ≤ pH) = F(pH) → pbeta(pH, a, b) • P(p≥ pH) = – F(pH) → – pbeta(pH, a, b) Định bậc (Tính giá trị p0 biết F(p0)): p0 = p[F(pH)] → qbeta(F(pH), a, b) Dựng đường cong phân phối beta: • Vẽ đường cong: curve(dbeta(x, a, b), xlim = c(x1, x2), ylim = c(y1, y2), xlab = “…”, ylab = “…”, main = “…”, add = …, col = ‘i’, lty = i, lwd = i) Trong đó:  dbeta(x, a, b): Hàm mật độ xác suất y = f(x, a, b)  xlim = c(x1, x2) vaø ylim = c(y1, y2): Định giới hạn trục Ox, Oy  xlab = “…” ylab = “…”: Ghi tên trục Ox, Oy  main = “…”: Ghi tên biểu đồ  add = T: Vẽ thêm đường biểu diễn vào biểu đồ có sẵn  col = ‘i’: Định màu cho đường biểu diễn, ‘i’ ‘red’, ‘green’, ‘blue’, …  lty = i: Định loại nét cho đường biểu diễn, i = (mặc định), 2, 3, …  lwd = i: Định độ dày nét cho đường biểu diễn, i = (mặc định), 2, 3, … • Tên biểu đồ: Nếu hàm curve(), ta chưa ghi tên biểu đồ sau thực hàm curve(), ta dùng hàm sau để ghi tên biểu đồ: title(main = “…”) • Ghi chú: SVTH: Nguyễn Ngọc Bảo Trân Trang 33 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm legend(x0, y0, c(‘…’, ‘…’, …), col = c(par(“fg”), ‘i 1’, ‘i2’, …), lty = c(i1, i2, …), lwd = c(i1, i2, …), bty =”n”, cex = i) Trong đó:  x0, y0: Tọa độ góc bên trái khung ghi theo trục Ox, Oy Nếu muốn góc bên trái khung ghi trùng với khung biểu đồ thay (x0, y0) (par(‘usr’) [1], par(‘usr’) [4], xjust = 0) Nếu muốn góc bên phải khung ghi trùng với khung biểu đồ dùng (par(‘usr’) [2], par(‘usr’) [4], xjust = 1)  c(‘…’, ‘…’, …): Ghi tên đường biểu diễn  col = c(par(“fg”), ‘i1’, ‘i2’, …): Thể màu đường biểu diễn với par(“fg”) màu mặc định (màu đen), ‘i’ maøu ‘red’, ‘green’, ‘blue’, …  lty = c(i1, i2, …): Thể loại nét đường biểu diễn, i = 1, 2, 3, …  lwd = c(i1, i2, …): Thể độ dày nét đường biểu diễn, i = 1, 2, 3, …  bty = “n”: Bỏ vòng bao quanh khung ghi  cex = i: Định kích thước chữ viết, mặc định i =  Ví dụ: Vẽ đường cong coù (a, b) = (1, 1), (2, 1), (3, 1), (4, 1), (2, 2), (3, 2), (4, 2), (2, 3), (3, 3), (4, 3) Trên đường cong (3, 2), tìm F(p 0) hay P(p ≤ p0) biết p0 = 0,5 tìm khoảng tin cậy hai phía ứng với mức ý nghóa α = 0,05 • Vẽ đường cong: curve(dbeta(x, 1, 1), xlim = c(0,1), ylim = c(0, 4), xlab = “p”, ylab = “f(p)”, main = “Phan phoi beta”) curve(dbeta(x, 2, 1), add = T, col = ‘red’) curve(dbeta(x, 3, 1), add = T, col = ‘green’) curve(dbeta(x, 4, 1), add = T, col = ‘blue’) curve(dbeta(x, 2, 2), add = T, col = ‘red’, lty = 2, lwd = 2) curve(dbeta(x, 3, 2), add = T, col = ‘green’, lty = 2, lwd = 2) curve(dbeta(x, 4, 2), add = T, col = ‘blue’, lty = 2, lwd = 2) curve(dbeta(x, 2, 3), add = T, col = ‘red’, lty = 3, lwd = 3) curve(dbeta(x, 3, 3), add = T, col = ‘green’, lty = 3, lwd = 3) curve(dbeta(x, 4, 3), add = T, col = ‘blue’, lty = 3, lwd = 3) legend(par(‘usr’) [1], par(‘usr’) [4], xjust = 0, c(‘(1, 1)’, ‘(2, 1)’, ‘(3, 1)’, ‘(4, 1)’, ‘(2, 2)’, ‘(3, 2)’, ‘(4, 2)’, ‘(2, 3)’, ‘(3, 3)’, ‘(4, 3)’), col = c(par(“fg”), ‘red’, ‘green’, ‘blue’, ‘red’, ‘green’, ‘blue’, ‘red’, ‘green’, ‘blue’), lty = c(1, 1, 1, 1, 2, 2, 2, 3, 3, 3), lwd = c(1, 1, 1, 1, 2, 2, 2, 3, 3, 3), cex = 0.75) • Trên đường cong (a, b) = (3, 2):  Tìm F(pH) biết pH = 0,5: pbeta(0.5, 3, 2) → F(pH) = 0,3125  Tìm khoảng tin cậy hai phía (p1, p2) biết α = 0,05: F(p1) = α/2 = 0,025: qbeta(0.025, 3,2) → p1 = 0,1941 F(p2) = – α/2 = 0,975: qbeta(0.975, 3,2) → p2 = 0,9324 SVTH: Nguyễn Ngọc Bảo Trân Trang 34 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm Hình P2.1: Các đường cong phân phối beta SVTH: Nguyễn Ngọc Bảo Trân Trang 35 GVHD: Ts Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hà Duyên Tư Kỹ thuật phân tích cảm quan thực phẩm NXB Khoa học Kỹ thuật Hà Nội, 2006 [2] Nguyễn Đình Huy (chủ biên) – Đậu Thế Cấp Xác suất thống kê, (1): – 22 NXB ÑHQG Tp HCM, 2003 [3] Nguyễn Hoàng Dũng Thực hành đánh giá cảm quan NXB ĐHQG Tp HCM, 2006 [4] Nguyễn Văn Tuấn Hướng dẫn thực hành Phân tích số liệu tạo biểu đồ R NXB Khoa học Kỹ thuật, 2007 [5] Harry T Lawless, Hildegarde Heymann, Nguyễn Hoàng Dũng biên dịch Đánh giá cảm quan – Nguyên tắc thực hành NXB ĐHQG Tp HCM, 2007 Tiếng Anh [6] Jian Bi “Dificulties and a way out: A Bayesian approach for sensory difference and preference tests”, Journal of sensory and studies [7] Jian Bi, Daniel M Ennis “The power of A - notA method”, The Institute for Perception, 343 – 359, 1999 [8] Leire Carbonell, Inmaculada Carbonell, Luis Izquierdo “Triango tests Number of discriminators estimated by Bayes’rule”, Food Quality and Preference 18, 117 – 120, 2007 [9] Pierre - Simon Laplace (1774/1986) “Memoir on the Probability of the Causes of Events”, Statistical Science, 1(3):364 – 378 [10] Stephen M Stigler (1986) “Laplace's 1774 memoir on inverse probability”, Statistical Science, 1(3):359 – 378 [11] Thomas Bayes – Richard Price (1763) “An Essay towards solving a Problem in the Doctrine of Chances”, Philosophical Transactions of the Royal Society of London, 53 Web sites www.blackwellpublishing.com www.ifpress.com www.sciencedirect.com www.wikipedia.org SVTH: Nguyễn Ngọc Bảo Trân Trang 36 ... ĐAMH Công nghệ Thực phẩm V SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ CỔ ĐIỂN Bảng V.1: So sánh thống kê Bayesian với thống kê cổ điển Đặc điểm Thống kê. .. dựa phép xử lý thống kê thông tin thu thập từ người thử Mỗi phép thử tập hợp đánh giá riêng lẻ người tham gia, xếp theo phương thức định trước phù hợp với phép toán thống kê  Phép thử phân biệt: ... Dũng ĐAMH Công nghệ Thực phẩm I TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN [1] [3] Sơ lược đánh giá cảm quan 1.1 Định nghóa “Đánh giá cảm quan phương pháp khoa học sử dụng để gợi

Ngày đăng: 21/03/2015, 13:24

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • I. TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN [1] [3]

    • 1. Sơ lược về đánh giá cảm quan

      • 1.1. Đònh nghóa

      • 1.2. Các phương pháp đánh giá cảm quan

      • 1.3. Các nguyên tắc cơ bản trong đánh giá cảm quan

      • 1.4. Vai trò của đánh giá cảm quan

      • 2. Phép thử phân biệt

        • 2.1. Mục đích

        • 2.2. Các phép thử phân biệt

        • 2.3. Nhóm người đánh giá cảm quan (người thử)

        • 2.4. Ứng dụng

        • II. TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN

        • [2] [9] [10] [11]

          • 1.Nguồn gốc

          • 2. Nội dung

            • 2.1. Các khái niệm cơ bản

            • 2.2. Đònh lý Bayes

            • 3. Ý nghóa

            • 4. Ứng dụng

            • III. CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ PHÂN BIỆT [1] [2] [4]

              • 1. Nguyên tắc chung

              • Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H0 và H theo nguyên tắc xử lý số liệu trong phép thử phân biệt

              • 2. Các phương pháp xử lý số liệu trong phép thử phân biệt

                • 2.1. Kiểm đònh Khi - bình phương 2

                • 2.2. Kiểm đònh nhò phân (binomial test)

                • Nếu giả thiết H0 đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), gọi xác suất người thử trả lời đúng trong mỗi phép thử là p. Ta có trong phép thử:

Tài liệu cùng người dùng

Tài liệu liên quan