Nhận dạng thực phẩm tươi bằng hình ảnh

26 1.2K 4
Nhận dạng thực phẩm tươi bằng hình ảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnh

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LƯU TIẾN THÀNH NHẬN DẠNG THỰC PHẨM TƯƠI SỐNG BẰNG HÌNH ẢNH CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 TÓM TẮT LUẬN VĂN THẠC SĨ (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS PHẠM VĂN CƯỜNG HÀ NỘI - 2016 Luận văn hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS Phạm Văn Cường Phản biện 1: TS Nguyễn Duy Phương………………… Phản biện 2: PGS.TS Nguyễn Ngọc Hóa……………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thông Vào lúc: ngày 20 tháng năm 2016 Có thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thông MỞ ĐẦU Tính cấp thiết đề tài Thực phẩm vấn đề tất yếu sống, chúng cung cấp chất dinh dưỡng cho phát triển thể Thực phẩm với chế độ dinh dưỡng hợp lý đảm bảo sức khỏe người Ngược lại, chế độ dinh dưỡng bất hợp lý dẫn tới bệnh nghiêm trọng tim mạch, tiểu đường, béo phì… Đặc biệt năm gần đây, bệnh béo phì gia tăng nhanh chóng lứa tuổi, tầng lớp quốc gia, tạo nên gánh nặng to lớn tiến toàn nhân loại Tại Việt Nam, theo Cục Y tế dự phòng, Bộ Y tế cho biết, tỷ lệ người trưởng thành bị thừa cân béo phì chiếm khoảng 25% dân số [1] Trong xã hội đại, tình trạng thừa cân, béo phì người trưởng thành có xu hướng ngày phổ biến trở thành thách thức lớn chương trình chăm sóc sức khỏe quốc gia.Nguyên nhân thừa cân, béo phì tình trạng cân lượng lượng calo đưa vào thể lượng calo sử dụng Điều cho thấy cần có chế độ dinh dưỡng khoa học phù hợp cho cá nhân để đảm trọng lượng thể mức cần thiết Một hệ thống nhận dạng thực phẩm hàng ngày với chi phí thấp, độ xác cao cần thiết Dựa hệ thống này, thực xây dựng ứng dụng quản lý chế độ dinh dưỡng tảng di động nhằm đảm bảo tính cá nhân, tự động dễ sử dụng Mục đích nghiên cứu Mục đích nghiên cứu luận văn nhằm xây dựng hệ thống nhận dạng thực phẩm, dựa hệ thống này, xây dựng ứng dụng quản lý chế độ dinh dưỡng nhằm giúp cho người dùng quản lý theo dõi chế độ dinh dưỡng hàng cách hiệu Dữ liệu thu từ ứng dụng giúp chuyên gia y tế tốt việc theo dõi đưa phác đồ điều trị hợp lý Việc nhận dạng loại thực phẩm dựa việc phân loại hình ảnh thuật toán học máy rừng ngẫu nhiên (Random Forest) máy hỗ trợ vector(SVM) Do đó, cần nghiên cứu nắm vững kiến thức xử ảnh học máy Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu thuật toán xử lý ảnh, nhằm cung cấp tập liệu tốt cho việc nhận dạng thực phẩm Cùng với cần nghiên cứu hiểu rõ thuật toán học máy Random Forest SVM nhằm đưa đánh giá khách quan tính hiệu hai thuật toán việc nhận dạng thực phẩm từ hình ảnh xử lý, từ đưa định thuật toán sử dụng cho hệ thống ứng dụng Trên thực tế, thực phẩm hàng ngày đa dạng phong phú, khó cho việc nhận dạng chí mắt thường đặc điểm bên chúng tương thịt gà thịt vịt, thịt bò thịt lợn Vì khuôn khổ luận văn này, tập trung vào phạm vi nhận dạng loại thực phẩm tươi rau, củ, giai đoạn tiền chế biến Phương pháp nghiên cứu Luận văn sử dụng thuật toán phân cụm K-mean để phân đoạn hình ảnh, sau thực trích chọn đặc trưng màu sắc, SURF, kết cấu, hình dạng; rút trích vector đặc trưng (feature extractor) nhằm cung cấp đầu vào cho thuật toán SVM thuật toán Random Forest phục vụ cho việc phân loại hình ảnh Cuối cùng, thực so sánh, đánh giá hai thuật toán mặt hiệu năng, chi phí, độ xác để chọn thuật toán tốt dựa để xây dựng hệ thống nhận dạng ứng dụng CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG THỰC PHẨM Trong chương nói toán nhận dạng thực phẩm cần thiết phải xây dựng toán, số nghiên cứu trước hạn chế toán nhận dạng thực phẩm nhằm tìm phương pháp tiếp cận phù hợp, đưa khía cạnh, giả định giới hạn phạm vi nghiên cứu cho toán 1.1 Bài toán nhận dạng thực phẩm Chế độ dinh dưỡng có tác động đáng kể tới sức khỏe Các nghiên cứu trước [16] nhiều bệnh cao huyết áp, tiểu đường đau dày, béo phì liên quan trực tiếp tới chế độ dinh dưỡng ko cân bằng.Theo báo cáo Hiệp hội Tim mạch Hoa Kỳ [3], có tới 154 triệu người Hoa Kỳ bị béo phì thừa cân (chỉ số thể BMI vượt 25kg/m2) Chi phí ước tính cho việc quản lý điều trị vào khoảng 254 tỷ USD năm 2013 tăng lên tới 927 tỷ USD năm 2030, khoảng 18% ca tử vong có liên quan tới béo phì [24] gây ảnh hưởng xấu tới kinh tế y học Không có ngoại lệ Việt Nam, theo báo cáo thống kê [36] tổ chức y tế giới WHO năm 2015, tỷ lệ người trưởng thành bị béo phì chiếm khoảng 3.55% (2.3% nam giới 4.8% nữ giới) với tổng chi phí điều trị 600 triệu USD năm Chính phủ chi Nguyên nhân thừa cân, béo phì tình trạng cân lượng lượng calo đưa vào thể lượng calo sử dụng Chìa khóa vấn đề đưa chế độ dinh dưỡng phù hợp cho cá nhân việc nắm rõ thành phần thực phẩm chuẩn bị cho bữa ăn giải pháp quan trọng cho vấn đề Một hệ thống quản lý chế độ dinh dưỡng với chi phí thấp, độ xác cao cần thiết Dựa hệ thống này, tiến hành xây dựng ứng dụng quản lý dinh dưỡng dựa tảng di động nhằm đảm bảo tính cá nhân, tự động dễ sử dụng Dữ liệu hệ thống ghi lại giúp chuyên gia y tế đưa phác đồ điều trị xác Lợi ích hệ thống không giúp bệnh nhân béo phì mà hỗ trợ quản lý tất vấn đề liên quan tới kiểm soát dinh dưỡng, trọng lượng 1.2 Các nghiên cứu trước Trước có số nghiên cứu nhằm xây dựng hệ thống quản lý dinh dưỡng Đại học Carnegie Mellon đưa hệ thống quản lý chế độ dinh dưỡng người bệnh tiểu đường dựa thực đơn nhằm ghi lại thực phẩm tiêu thụ hàng ngày gọi tắt DIMA (Diabetes Management Assistant) [5][17] Hệ thống cho phép chụp ảnh bữa ăn lưu vào nhật ký điện tử (ghi log) thay cho việc ghi chép thủ công Wellness Diary dự án nghiên cứu Nokia Beta Labs [26][48]nhằm xây dựng ứng dụng di động cho phép theo dõi sức khỏe hàng ngày người sử dụngđược viết hệ điều hành Symbian Series 60 cho thiết bị di động Với ứng dụng, người dùng giám sát loạt thông số giấc ngủ, trọng lượng, chế độ tập thể dục đặc biệt chế độ ăn ưống, tất thực qua việc ghi chép thủ công Hiện tại, MyFitnessPal [23] ứng dụng miễn phí cho phép theo dõi chế độ ăn uống, luyện tập để xác định lượng calor tối ưu chất dinh dưỡng phù hợp người sử dụng Một điểm đáng khen ứng dụng việc tự động nhận biết khối lượng calo thực phẩm dựa tính quét mã BarCode Tuy nhiên, điểm hạn chế đáng tiếc hệ thống việc bắt buộc người dùng phải tự ghi chép thủ công bữa ăn thực phẩm tiêu thụ hàng ngày gây bất tiện, tốn thời gian Việc nhận dạng thực phẩm tự động dựa hình ảnh khó khăn, thách thức hay gặp phải việc thực phẩm bị biến dạng, chồng chéo lên nhiễu bất lợi từ môi trường thu thập Những nỗ lực nghiên cứu trước giới hạn số loại thực phẩm cụ thể cá, thịt, cam, quýt [20] Các nỗ lực khác bị giới hạn xếp thực phẩm đĩa khay ngăn chia cách chúng [33][12] Một thuật toán nhận dạng thực phẩm dựa việc nhận dạng hộp đựng thức ăn phát triển nhằm mục đích điều chỉnh cài đặt lò vi sóng theo thức ăn hộp với quy tắc xác định trước vị trí loại thực phẩm hộp, loại thực phẩm gán với vị trí cụ thể hộp, gọi đồ xếp thực phẩm [33] Tuy nhiên nỗ lực hướng tới việc sử dụng nhận dạng thực phẩm lĩnh vực lớn y tế công nghệ hỗ trợ Một nỗ lực phát triển cho môi trường bệnh viện dựa phương pháp rút trích đĩa thức ăn sử dụng Mạng Nơron dựa thuật toán nhận dạng ảnh cho phép đo lượng thức ăn [12] Tuy nhiên, trường hợp này, thuật toán bị giới hạn miền loại thực phẩm phục vụ bệnh viện vị trí chúng khay Phần lớn nghiên cứu trước tập trung vào nhận dạng thực phẩm nấu chín [33][19][18] thực phẩm ăn liền [19][35] Trong việc nhận dạng thực phẩm tươi sống quan tâm Vì cố gắng tập trung vào việc nhận dạng thực phẩm giai đoạn tiền chế biến, tin việc giúp người dùng chủ động việc lựa chọn loại thực phẩm chế biến chúng Ngoài ra, nghiên cứu phương pháp ko đáp ứng nhu cầu sử dụng hàng ngày chúng không dựa kiến trúc tảng di động Chúng cố gắng để thu hẹp khoảng cách sức khỏe cá nhân, công nghệ người sử dụng cách đưa việc giám sát dinh dưỡng lên thiết bị di động 1.3 Phương pháp tiếp cận Chúng đề xuất hệ thống quản lý dinh dưỡng để giải vấn đề Hình ảnh thực phẩm người dùng chụp điện thoại di động với độphân giải thấp Từ hình ảnh này, hệ thống thực phân loại thực phẩm qua bước tiền xử lý ảnh, phân đoạn, trích chọn đặc trưng phân loại Hình 1.4: Giải pháp quản lý dinh dưỡng 1.4 Các vấn đề toán nhận dạng ảnh Việc nhận dạng thực phẩm dựa hình ảnh phức tạp có nhiều khía cạnh cần xem xét bỏ qua Một số khía cạnh cần xem xét sau 1.4.1 Các khía cạnh chung toán nhận dạng ảnh  Sự co giãn hình ảnh:Hình ảnh thực phẩm chụp từ khoảng cách khác tạo cảm nhận thiếu xác kích thước thực thực phẩm  Sự xoay ảnh: Hình ảnh chụp khoảng cách với góc xoay khác cần xem xét, nótạo cảm giác sai lệch hình dạng thực phẩm  Hướng chụp: Khi thực phẩm chụp góc khác nhau, chúng trông hoàn toàn khác với cách chụp từ xuống, trái qua phải Các tính chất dãy màu sắc, kết cấu, hình dạng liệu khác thay đổi đáng kể  Chất lượng camera: Không phải tất máy di động cho chất lượng ảnh Thậm chí thiết bị, tùy thuộc vào người sửdụng có thiết lập khác  Độ sáng khác nhau: Đây yếu tố ảnh hưởng lớn tới chất lượng ảnh Không phải tất ảnh chụp điều kiện ánh sáng tương tự Mộtsự thay đổi ánh sáng nhỏ thay đổi hình ảnh đáng kể, màu tím chụp điều kiện ánh sáng mạnh khó phân biệt với màu đen Đôi cóthể xuất bóng gây biến dạng đặc trưng, gây ảnh hưởng nghiêm trọng tới trình phân loại 1.4.2 Các khía cạnh riêng toán nhận dạng thực phẩm  Vị trí thực phẩm: Thứ tự hình ảnh đứng trước, đứng sau, hay thấy góc thực phẩm Việc làm tăng tính phức tạp việc xácnhận hình ảnh thực loại thực phẩm có hình  Sự đa dạng hình dạng: Không phải tất loại thực phẩm có hình dạng giống cho lần chụp Mỗi ảnh chụp khung cảnh cho hình dạng khác với loại thực phẩm Thực tế loại thực phẩm có nhiều hình dạng khác  Sự thay đổi kết cấu hình ảnh: Điều kiện ánh sáng điều kiện bảo quản thay đổi kết cấu thực phẩm  Sự chồng chéo: loại thực phẩm bị xếp chồng chéo đè lên nhau, số bị che lấp gây khó khăn sai lệch cho việc nhận dạng  Bối cảnh lộn xộn: thực phẩm chụp bối cảnh khác nhau, trongsiêu thị, bếp gây ảnh lộn xộn khiến việc phát hiệnđối tượng, loại bỏ phông trở nên khó khăn 1.5 Các giả định toán Dựa vấn đề nêu trên, xem xét hình ảnh cho toán nhận dạng thực phẩm với giả định sau:  Không chạm vào đối tượng: để hạn chế khả đối tượng bị chồng chéo, che lấp, dễ dàng cho việc phân cụm  Chụp tổng thể đối tượng: dễ dàng nhận biết đối tượng dựa hình dạng, màu sắc, kích thước thực chúng, tính toán lượng calore chuẩn xác  Màu chung: màu phông đơn màu, thuận tiện cho việc phân đoạn ảnh, cẩn tập trung vào đối tượng phát  Nền nhẹ đối tượng: nhằm dễ dàng áp dụng kỹ thuật loại bỏ phông  Hạn chế bóng tối ánh sáng đèn flash: Để tránh trường hợp đặc trưng thực phẩm bị tổn hại xuất bóng đối tượng điểm đèn flash 1.6 Phạm vi nghiên cứu Trong thực tế có nhiều loại thực phẩm với đặc điểm hình dáng, màu sắc, kích thước giống trứng gà trứng vịt, loại thịt Để có hệ thống nhận dạng xác trực tiếp từ nhiều nguồn cần nhiều trích chọn đặc trưng cho loại thực phẩm tập liệu lớn Việc đòi hỏi nhiều thời gian trình thu thập liệu nghiên cứu Trong luận văn này, dừng lại việc nhận dạng loại rau, củ, giai đoạn tiền chế biến với số lượng từ tới 12 loại Tập liệu dùng để nhận dạng hình ảnh thu thập điện thoại di động độ phân giải thấp với số lượng từ 2000 tới 3000 ảnh 1.7 Kết luận chương Trong chương này, trình bày tổng quan toán nhận dạng thực phẩm, thực trạng bệnh thừa cân, béo phì tác động xấu tới Việt Nam giới, từ đưa giải pháp xây dựng hệ thống quản lý dinh dưỡng tảng di động nhằm giúp đỡ bệnh nhân béo phì việc kiểm soát dinh dưỡng, trọng lượng đưa phác đồ điều trị thích hợp Chúng nêu hạn chế hệ thống quản lý dinh dưỡng trước đây, hầu hết hệ thống thực việc kiểm soát dinh dưỡng cách thủ công thông qua việc chép tay loại thực phẩm, bữa ăn tiến thông qua việc quét mã barcode Công việc nhận dạng thực phẩm tự động khó khăn gặp phải thách thức thực phẩm bị biến dị, chồng chéo lên nhau, khay đựng, nhiễu từ môi trường thu thập ….Các nghiên cứu trước dường tập trung vào thực phẩm nấu chín với kết hạn chế Vì cố gắng tập trung vào việc nhận dạng thực phẩm giai đoạn tiền chế biến nhằm giúp người dùng chủ động việc lựa thực phẩm Chúng cố gắng thu hẹp khoảng cách sức khỏe cá nhân, công nghệ người sử dụng hệ thống đề xuất Hình 1.4 Hệ thống thực tiền xử lý, phân đoạn, rút trích đặc trưng phân loại ảnh nhằm tính toán lượng calor cần thiết cho người sử dụng Việc nhận dạng thực phẩm dựa hình ảnh phức tạp có nhiều khía cạnh cần xem xét bỏ qua Chúng trình bày khía cạnh chung toán nhận dạng ảnh, khía cạnh riêng toán nhận dạng thực phẩm; dựa vấn đề này, đưa giả định cho toán nhận dạng thực phẩm nghiên cứu Chúng giới hạn phạm vi nghiên cứu toán gồm loại rau, củ, giai đoạn tiền chế biến với số lượng từ tới 12 loại Tập liệu thu thập điện thoại di động độ phân giải thấp với số lượng từ 2000 tới 3000 ảnh CHƯƠNG 2: PHƯƠNG PHÁP NHẬN DẠNG THỰC PHẨM Trong chương này, trình bày bước thuật toán sử dụng hệ thống nhận dạng thực phẩm: thuật toán K-mean nhằm phân đoạn ảnh, kỹ thuật trích chọn đặc trưng, thuật toán SVM, thuật toán Random Forest phục vụ cho việc phân loại ảnh Phương pháp quản lý chế độdinh dưỡng đưa nhằm xây dựng hệ thống nhận dạng thực phẩm quản lý dinh dưỡng phù hợp 2.1 Tiền xử lý ảnh Trong trình thu thập, ảnh bị nhiễu độ tương phản thấp nên cần đưa vào tiền xử lý để nâng cao chất lượng, làm ảnh rõ nét không bị hay bị biến dạng tính chất màu sắc, kết cấu Sau điều chỉnh ảnh kích thước mong muốn (300x300), tiến hành khử nhiễu mờ cách sử dụng lọc trung vị (Median Filter) Sau đó, ảnh tiếp tục xử lý để tăng độ tương phản Việc điều chỉnh giúp ảnh sau phân đoạn thể đầy đủ tính chất màu sắc kết cấu 2.2 Phân đoạn ảnh Sau tiền xử lý, chọn thuật toán K-mean để tiến hành phân đoạn dựa đặc trưng màu sắc ảnh K-mean thuật toán quan trọng sử dụng phổbiến kỹ thuật phân cụm với khả cài đặt dễ dàng độ phức tạp tuyến tính Tư tưởng thuật toán K-mean tìm cách phân nhóm đối tượng cho vào K cụm (K số cụm xác định trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm nhỏ Giải thuật K-mean trình bày tóm tắt sau: 10 2.3 Trích chọn đặc trưng 2.3.1 Đặc trưng màu sắc Màu sắc đặc trưng bật dựa bề mặt đối tượng ảnh Mỗi điểm ảnh (thông tin màu sắc) biểu diễn điểm không gian màu sắc ba chiều RGB Chúng tiến hành rút trích hai đặc trưng màu sắc moment màu (color moment) biều đồ màu (color Histogram) Chúng không bị ảnh hưởng dịch chuyển hay xoay ảnh bị ảnh hưởng tỷ lệ góc nhìn [32] 2.3.2 Đặc trưng SURF SURF (Speed Up Robust Features) đặc trưng mạnh mẽ sử dụng để nhận dạng phân loại đối tượng lĩnh vực thị giác máy tính, SURF giới thiệu lần Herbet Bay nhóm cộng hội nghị European Conference on Computer Vision năm 2006 [31] Đặc trưng SURF tính mô tả dựa máy dò Fast-Hessan chứng minh tính hiệu xử lý ảnh mờ (có khả rút trích đặc trưng từ hình ảnh bị mờ) Hơn nữa, đặc trưng SURF bất biến với tính chất co giãn xoay ảnh, đặc điểm quan trọng việc phân loại thực phẩm ảnh thu thập chụp với góc xoay khoảng cách khác Hình 2.6: Các điểm bật phát 11 Thuật toán SURF gồm hai phần “phát hiện” “mô tả” Bộ phát đặc trưng SURF sử dụng phép xấp xỉ ma trận Hessian ảnh tích hợp (Intergal Image) [27] để nâng cao hiệu tính toán cách đáng kể Bộ mô tả đặc trưng sử dụng vector 64 chiều chứa thông tin biến thiên ảnh dựa phân phối bậc Haar Wavelet tác động trục x y, kết hợp với ảnh tích lũy làm tăng tốc độ tính toán Trong hệ thống chúng tôi, SURF-64 lựa chọn để tiến hành rút trích đặc trưng Mỗi ảnh chọn 32 điểm đặc trưng, điểm đặc trưnglà vector SURF 64 chiều Như thu đặc trưng SURF vector 32x64 = 2048 phần tử, vector đặc trưng SURF kết hợp vector màu sắc, hình dáng kết cấu để tạo nên vector đặc trưng kết hợp làm đầu vào cho thuật toán học máy 2.3.3 Đặc trưng hình dạng Hình dạng (shape) biết đến đặc trưng quan nhận dạng phân loại đối tượng giới thực, mà mục đích để mã hóa loạihình học đơn giản đường thằng theo hướng khác Kỹ thuật trích xuất đặc trưng hình dạng phân loại thành hai nhóm phương pháp dựa vào đường biên (boundary-based) phương pháp dựa khu vực (region-based) [11] Trong nghiên cứu này, lựa chọn tám đặc trưng "Area", "Perimeter", "Euler Number", "Convex Area", "Solidity", "Minor Lenght", "Major Lenght" "Eccentricity" chúng chia vào nhóm sau:  "Area", "Perimeter", "Euler Number" trích xuất trực tiếp từ đối tượng  Tạo vỏ lồi phương pháp quét Graham [21], đa giác lồi nhỏ bao quanh đối tượng, từ trích xuất đặc trưng "Convex Area"và "Solidity"  Tạo hình Elipse bao quanh đối tượng, từ rút trích đặc trưng "Minor lenght", "Major lenght" "Eccentricity" Hình 2.11: Ảnh gốc, đa giác lồi Elipse bao quanh đối tượng 12 2.3.4 Đặc trưng kết cấu Đặc trưng kết cấu tập hợp số tính toán xử lý ảnh, thiết kế để xác định số lượng kết cấu ảnh Đặc trưng kết cấu cung cấp thông tin cách tổ chức không gian màu sắc cường độ sáng ảnh vùng chọn [32] Để phân loại đặc trưng cấu trúc ảnh, người ta thường sử dụng hai phương pháp chình Phương pháp dựa cấu trúc (Structured) Phương pháp dựa thống kê (Statistical) Phương pháp dựa cấu trúc trình bày cấu trúc tập hợp texel mô hình thường xuyên lặp lại [4] Phương pháp hoạt động tốt phân tích kết cấu nhân tạo, tỏ hữu ích cho việc tổng hợp phân tích ảnh.Phương pháp dựa thống kê trình bày kết cấu gián tiếp tính chất không xác định quản lý việc phân phối quan hệ mức xám ảnh [4], phù hợp với kết cấu tự nhiên tính toán dễ dàng Trong luận văn chọn Phương pháp dựa thống kê để trích xuất đặc trưng kết cấu phù hợp với kết cấu tự nhiêncủa thực phẩm tiền chế biến dễ dàng tính toán, sử dụng Chúng thực trích chọn bảy đặc trưng theo phương pháp bao gồm Contrast, Homogeneity,Energy Correlation dựa ma trận đồng mức xám (Co-occurrence Maxtrix) Ngoài thực rút trích đặc trưng khác Mean, Variance Entropy dựa biểu đồ thống kê mức xám ảnh 2.4 Phân loại hình ảnh Từ việc trích chọn đặc trưng, thu vector đặc trưng, vector gồm bốn loại đặc trưng màu sắc, SURF, hình dạng kết cấu Từ vector đặc trưng này, sử dụng độc lập hai thuật toán học máy SVM RandomForest để phân loại hình ảnh nhằm so sánh hiệu chúng chọn thuật toán tốt cho hệ thống 2.4.1 Bài toán phân lớp Phân lớp tiến trình xử lý nhằm xếp mẫu liệu hay đối tượng vào lớp định nghĩa trước Các mẫu liệu hay đối tượng xếp vào lớp dựa vào giá trị thuộc tính cho mẫu liệu hay đối tượng Sau xếp tất đối tượng biết trước vào lớp tương ứng lớp đặc trưng tập thuộc tính đối tượng chứa lớp Quá trình phân lớp gọi 13 trình gán nhãn cho tập liệu Nhiệm vụ toán phân lớp liệu cần xây dựng mô hình (bộ) phân lớp để có liệu vào mô hình phân lớp cho biết liệu thuộc lớp Có nhiều cách để biểu diễn mô hình phân lớp có nhiều thuật toán giải Các thuật toán phân lớp tiêu biểu bao gồm mạng nơron, định, suy luận quy nạp, mạng Beyesian, Support Vector Machine (SVM), Random Forest… Trong kỹ thuật trên, SVM RandomForest giải thuật học nhanh, chịu đựng nhiễu tốt phân lớp hiệu tập liệu có số chiều lớn 2.4.2 Thuật toán máy hỗ trợ vector (SVM) Thuật toán máy hỗ trợ vector (SVM) [29] xây dựng siêu phẳng tập hợp siêu phẳng không gian nhiều chiều vô hạn chiều, sử dụng cho phân loại, hồi quy, nhiệm vụ khác Mục tiêu thuật toán xác định xem điểm liệu thuộc lớp Mỗi điểm liệu biểu diễn dạng vector p - chiều, ta muốn biết liệu chia tách hai lớp liệu siêu phẳng p − chiều, gọi phân loại tuyến tính Có nhiều siêu phẳng phân loại liệu, lựa chọn hợp lý chúng siêu phẳng có lề lớn hai lớp Hình 2.14: Đường thằng tuyến tính 𝑯𝟏 (xanh lơ) 𝑯𝟐 (đỏ) phân tách hai lớp liệu  SVM cho toán phân lớp tuyến tính  Xác định siêu phẳng với lề cực đại  Kỹ thuật hàm nhân  Thiết lập tham số 14 Trong luận văn này, sử dụng thuật toán tối thiểu hóa (Sequential Minimal Optimization – SMO) phát minh John Platt Microsoft Research [28].SMO sử dụng rộng rãi cho việc huấn luyệnSVMvà thực thi công cụ LIBSVM phổ biến [9][22] Chúng chọn tham số 𝑪 = 𝟏và hàm nhân đa thức (polynomial kernel function) với 𝑑 = 1: 𝑲(𝒙, 𝒙′ ) = (𝒙𝑇 𝒙′ + 𝟏)𝑑 Khi đó, hàm nhân đa thức hàm tuyến tính SVM tuyến tính 2.4.3 Thuật toán rừng ngẫu nhiên (RandomForest) Rừng ngẫu nhiên phương pháp phân lớp thuộc tính dựa định phát triển Leo Breiman đại học California, Berkeley [7] Rừng ngẫu nhiên xây dựng dựa thành phần là: (1) CART, (2) học toàn bộ, hội đồng chuyên gia, kết hợp mô hình, (3) tổng hợp bootstrap (bagging) Rừng ngẫu nhiên xây dựng phân lớp cách lựa chọn ngẫu nhiên nhóm nhỏ thuộc tính nút để phân chia cho mức phân lớp, cách chia nhỏ không gian tìm kiếm thành nhỏ cho phép thuật toán phân loại nhanh dù không gian thuộc tính lớn Ngoài tập mẫu lựa chọn ngẫu nhiên phương pháp bootstrap từ tập mẫu ban đầu Số lượng phân lớp rừng không hạn chế “bỏ phiếu” cho lớp phổ biến Giải thuật rừng cho toán phân lớp trình bày sau:  Cho tập huấn luyện 𝐷 = {(𝒙𝑖 , 𝑦𝑖 ): 𝑖 = 1,2, … , 𝑛} Lấy 𝒌 mẫu bootstrap từ tập huấn luyện, mẫu gồm 𝒎 phần tử chọn ngẫu nhiên từ D Ta có tập mẫu𝐾 = {(𝐷𝑖 ): 𝑖 = 1,2, … , 𝑘} với 𝐷𝑖 = {(𝑥𝑗 , 𝑦𝑗 ): 𝑗 = 1,2, … , 𝑚}  Đối với rừng 𝒌 o Xây dựng phân lớp 𝑇𝑖 với tập 𝐷𝑖 lấy bootstrap từ D o Tại nút cây, chọn thuộc tính tốt để phân chia từ tập thuộc tính 𝐹𝑖 chọn ngẫu nhiên tập thuộc tính 𝐹 o Mỗi xây dựng đến độ sâu tối đa (không cắt nhánh)  Đưa dự đoán cách sử dụng kết số đông (bỏ phiếu) 15  Thiết lập tham số Qua việc thực nghiệm, chọn số lượng 300 cho trình huấn luyện Số lượng đảm bảo độ xác đủ tốt thời gian thực thi đủ nhanh 2.5 Quản lý chế độ dinh dưỡng 2.6 Kết luận chương Trong chương này, trình bày bốn bước hệ thống nhận dạng thực phẩm tươi hình ảnh Bước tiến hành tiền xử lý ảnh nhằm loại bỏ nhiễu không mong muốn nâng cao độ tương phản nhằm mục đích sử dụng thuật toán Kmean để phân đoạn ảnh đầu vào cách dễ dàng bước Từ trích chọn đặc trưng ảnh Bước cuối cùng, sử dụng vector đặc trưng bao gồm màu sắc, SURF, hình dạng, kích thước làm đầu vào cho hai thuật toán học máy rừng ngẫu nhiên (Random Forest) máy hỗ trợ vector (SVM) Phương pháp quản lý chế độ dinh dưỡng trình bày tạo sở cho việc xây dựng hệ thống nhận dạng thực phẩm quản lý dinh dưỡng phù hợp hiệu CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Tập liệu huấn luyện Tập liệu thu thập từ điện thoại di động (Microsoft Lumia 630, 8MP) độ phân giải thấp 640x480 điểm ảnh, tiến hành thu thập số hình ảnh mạng Tập ảnh thu thập gồm khoảng 2000-3000 ảnh 10 loại thực phẩm khác bao gồm: cà chua, cà rốt, dứa, dưa chuột, khoai tây, khổ qua, ớt đỏ, ớt vàng, ớt xanh susu phân loại tay vào hai nhóm chính:  Hình ảnh đơn thực phẩm (SingleFood): hình ảnh có loại thực phẩm Các hình ảnh đáp ứng giả định toán nêu phần 1.5 Số lượng rơi vào khoảng 2000 ảnh  Hình ảnh đa thực phẩm (MultiFood): hình ảnh có từ loại thực phẩm trở lên.Các hình ảnh đáp ứng giả định toán nêu phần 1.5 Số lượng khoảng 1000 ảnh 16 Loại thực phẩm Số lượng ảnh Cà chua 160 Cà rốt 166 Dứa 195 Dưa chuột 171 Khoai tây 134 Khổ qua 284 Ớt đỏ 264 Ớt vàng 264 Ớt xanh 220 Susu 181 Tổng 2039 Bảng 3.1: Tập liệu SingleFood Do thời gian hạn chế, tiến hành nghiên cứu thử nghiệm tập liệu SingleFood gồm 2039 ảnh, số lượng cụ thể loại liệt kê chi tiết Bảng 3.1 3.2 Thử nghiệm đánh giá Chúng tiến hành thử nghiệm đánh giá tập liệu SingleFood hai thuật toán SVM Random Forest Sau giai đoạn trích chọn đặc trưng, thu tập vector đặc trưng sử dụng để huấn luyện cho hai phân loại Tập vector đặc trưng chia vào nhóm huấn luyện sau:  Nhóm thứ nhất: gồm tập vector đặc trưng thu thập dựa đặc trưng màu sắc SURF (Color + SURF)  Nhóm thứ hai: gồm tập vector đặc trưng thu thập dựa đặc trưng màu sắc, SURF hình dạng (Color + SURF + Shape)  Nhóm thứ ba: gồm tập vector đặc trưng thu thập dựa đặc trưng màu sắc, SURF, hình dạng kết cấu (Color + SURF + Shape + Texture) Chúng sử dụng phương pháp kiểm thử 𝑘-fold cross validation[13] với 𝒌 = 𝟏𝟎 để tránh việc trùng lặp tập kiểm thử 17 Kết thử nghiệm gồm độ đo Precision (độ xác) Recall (độ bao phủ) tính toán theo công thức sau: Precision = TP/(TP + FP) Recall = TP/(TP + FN) Trong đó: TP (True Possitive): số lượng ví dụ thuộc lớp 𝐶𝑖 phân loại xác vào lớp 𝐶𝑖 FP (False Possitive): số lượng ví dụ không thuộc lớp 𝐶𝑖 bị phân loại nhầm vào lớp 𝐶𝑖 FN (False Negative): số lượng ví dụ thuộc lớp 𝐶𝑖 bị phân loại nhầm vào lớp khác 𝐶𝑖 3.2.1 Thử nghiệm đánh giá thuật toán SVM Chúng sử dụng thuật toán SMO [28] thực thi thư viện LibSVM [9][22] với tham số C = hàm nhân đa thức 𝑲(𝒙, 𝒙′ ) = (𝒙𝑇 𝒙′ + 𝟏)𝑑 ∶ (𝑑 = 1) Kết thu sau : SVM - Precision (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 30 Color + SURF + Shape + Texture 20 10 Cà Cà rốt chua Dứa Dưa Khoai chuột tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.2: Kết Precision chạy thử nghiệm với SVM 18 SVM - Recall (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 30 Color + SURF + Shape + Texture 20 10 Cà Cà rốt chua Dứa Dưa Khoai chuột tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.3: Kết Recall chạy thử nghiệm với SVM Từ kết trên, chúng thấy nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu cho kết phân loại tốt với giá trị trung bình Precision Recall đạt 93% Trong số này, cà chua khoai tây có kêt phân loại với Precision Recall đạt khoảng 80% Màu sắc củacà chua tương tự ớt đỏ, hình dạng tương tự khoai tây loại ớt số góc chụp khác nhau, quan trọng đặc trưng SURF chúng không mạnh đặc điểm riêng hình dạng có phần tương tự nhau, điều khiến việc phân loại dễ bị nhầm lẫn Số lại đạt kết cao với Precision Recall đạt 90%, dứa cho kết phân loại cao chúng có đặc trưng riêng biệt hình dạng khiến đặc trưng SURF chúng mạnh loại thực phẩm khác 3.2.2 Thử nghiệm đánh giá thuật toán Random Forest Chúng chọn số lượng 300 cho trình phân loại, giá trị chọn trình thực nghiệm cách thay đổi liên tục giá trị trình phân loại chọn kết tốt Kết thu sau: 19 Random Forest - Precision (%) 100 90 80 70 60 50 40 30 20 10 Color + SURF Color + SURF + Shape Color + SURF + Shape + Texture Cà Cà rốt Dứa chua Dưa Khoai Khổ chuột tây qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.4: Kết Precision chạy thử nghiệm với Random Forest Random Forest - Recall (%) 100 90 80 70 60 50 40 30 20 10 Color + SURF Color + SURF + Shape Color + SURF + Shape + Texture Cà Cà rốt Dứa chua Dưa Khoai Khổ chuột tây qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.5: Kết Recall chạy thử nghiệm với Random Forest Thuật toán rừng ngẫu nhiên cho kết phân loại tốt với nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu Giá trị trung bình Precision Recall đạt 95% Kết thấp nằm hai loại cà chua khoai tây, với giá trị Recall tương ứng 88% 75%; đặc trưng SURF hình dạng chúng tương tự nên chúng dễ bị phân loại nhầm vào lớp khác ngược lại, nhiên độ xác (Precision) chúng cải thiện đáng kể với kết đạt 90% 20 3.2.3 So sánh kết SVM Random Forest Từ việc thử nghiệm hai thuật toán, thấy nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu cho kết tốt Chúng tiến hành so sánh hai thuật toán dựa kết nhóm đặc trưng Kết so sánh trình bày Bảng 3.2 sau: Độ đo Loại thực phẩm Precision Recall SVM RF SVM RF Cà chua 85.4 97.9 87.5 88.1 Dứa 95.1 97 99 99.5 Dưa chuột 92 95.9 94.7 96.5 Khoai tây 82.5 100 77.6 75.4 Khổ qua 95.8 93 95.4 98.9 Ớt đỏ 94.7 93.1 94.7 97.3 Ớt vàng 95.4 91.3 94.3 99.6 Ớt xanh 98.6 96.9 95 98.6 Susu 95.5 96.9 93.9 87.3 Tổng 93.6 95.3 93.6 95.1 Bảng 3.2: So sánh kết chạy thực nghiệm SVM Random Forest (%) Từ bảng so sánh trên, thấy thuật toán Random Forest cho kết phân loại tốt hơn, đặc biệt việc nâng cao độ xác (Precision) Cà chua Khoai tây từ 85% tới 97%, hai loại thực phẩm có vector đặc trưng yếu chúng nhiều đặc trưng SURF riêng hình dạng tương tự nhau, đặc biệt màu sắc hình dạng cà chua tương tự ớt đỏ số góc chụp khác nhau.Tuy nhiên thuật toán Random Forest cải tiến đáng kể độ xác nhờ việc tiến hành dự đoán dựa kết số đông (bỏ phiếu) Chúng thấy đặc trưng SURF đóng vai trò chủ chốt việc tính toán độ xác phản hồi hai thuật toán Điều nhìn thấy dễ dàng qua kết phân loại Dứa, khổ qua loại ớt; chúng chứa đặc trưng SURF mạnh Ngoài trình nghiên cứu, tiến hành chạy thử nghiệm hai thuật toán hệ thống thực tế để so sánh hiệu thực Chúng sử dụng Matlab 21 R2016a (Image Processing Toolbox, Statistic Toolbox) để thực trình xử lý ảnh, phân đoạn, rút trích đặc trưng, huấn luyện nhận dạng Kết huấn luyện lưu vào tập tin nhị phân, trình phân loại liệu huấn luyện đọc từ tập tin nhị phân nhằm giảm chi phí mặt nhớthời gian Bỏ qua khía cạnh nhớ lưu trữ hệ thống, xem xét hiệu mặt thời gian.Thời gianchạy thực tế tính từ lúc ảnh thu thập có kết phân loại Kết thử nghiệm 10 loại thực phẩm khác trình bày Bảng 3.3 sau: Thuật toán Lần chạy SVM RF Lần 7.5 5.3 Lần 6.9 4.6 Lần 7.2 4.2 Lần 6.8 4.4 Lần 6.9 4.4 Lần 7.0 5.5 Lần 6.5 4.2 Lần 6.6 4.4 Lần 6.9 4.6 Lần 10 6.7 4.1 Trung bình 6.9 4.57 Bảng 3.3: So sánh thời chạy thực nghiệm SVM Random Forest (giây) Qua việc so sánh độ xác hiệu năng, thấy thuật toán rừng ngẫu nhiên cho kết phân loại cao hiệu tốt mặt thời gian thực, rừng ngẫu nhiên thuật toán lựa chọn để xây dựng hệ thống nhận dạng Các đặc trưng hệ thống sử dụng trình phân loại bao gồm màu sắc, SURF, hình dạng kết cấu 3.3 Hệ thống nhận dạng thực phẩm Chúng tiến hành xây dựng hệ thống FoodAutoManage nhằm quản lý dinh dưỡng cá nhân với kiến trúc thể Hình 3.6 22 Hình 3.6: Kiến trúc hệ thống FoodAutoManage Hệ thống chia làm hai phần bao gồm Client Server  Client: xây dựng tảng di động Windows 10 (Microsoft Lumia 650) dựa ngôn ngữ C# Client bao gồm hai module Input Output Input module cho phép người dùng thu thập ảnh từ camera hình ảnh có sẵn thiết bị, sau ảnh gửi tới Server để tiến hành xử lý Input module đồng thời tiến hành thu thập liệu nhằm ghi log hoạt động người dùng, điều khiến việc quản lý dinh dưỡng dễ dàng hơn, chuyên gia y tế dựa vào liệu để đưa dự đoán phác đồ điều trị dễ dàng Output module cho phép Client hiển thị thông tin kết trả từ Server, hiển thị thực phẩm người dùng lựa chọn, hiển thị danh sách log  Server: xây dựng tảng PC Windows 10, ngôn ngữ C# Matlab Việc kết nối truyền liệu Client Server thực thông qua kết nối không dây TCP/IP Module Server FoodRecognition thực ngôn ngữ Matlab (Matlab R2016a - Image Processing Toolbox, Statistic Toolbox), nhằm thực xử lý ảnh, phân đoạn (K-mean), rút trích đặc trưng, nhận dạng (Random Forest) trả kết Client Như trình bày phần 3.2.3, độ xác hệ thống rơi vào khoảng 95% Thời gian chạy trung bình phiên (tính từ lúc ảnh gửi từ phía 23 Client tới Server trả kết quả) rơi vào khoảng - giây Những kết khả thi để áp dụng hệ thống vào thực tế 3.4 Kết luận chương Trong chương này, nêu cách thức thu thập liệu huấn luyện sử dụng máy ảnh điện thoại di động (Microsoft Lumia 650, 8MP) độ phân giải thấp (640x480 pixel) Tập ảnh thu gồm khoảng 2000 tới 3000 ảnh 10 loại thực phẩm khác bao gồm: cà chua, cà rốt, dứa, dưa chuột, khoai tây, khổ qua, ớt đỏ, ớt vàng, ớt xanh susu phân loại tay vào nhóm hình ảnh đơn thực phẩm (SingleFood – 2000 ảnh) hình ảnh đa thực phẩm (MultiFood – 1000 ảnh) Do hạn chế mặt thời gian, tiến hành nghiên cứu thử nghiệm tập liệu SingleFood gồm 2039 ảnh liệt kê chi tiết Bảng 3.1 Kết thử nghiệm đánh giá tiến hành hai thuật toán SVM Random Forest tập vector đặc trưng chia thành nhóm huấn luyện (nhóm thứ gồm Color + SURF, nhóm thứ hai gồm Color + SURF + Shape nhóm thứ ba gồm Color + SURF + Share + Texture) Chúng sử dụng phương pháp kiểm thử 10 – fold cross validation để tránh việc trùng lặp tập kiểm thử Kết thu cho thấy Random Forest cho kết phân loại tốt nhóm huấn luyện thứ ba với kết độ xác bao phủ trung bình đạt 95%, thời gian phân loại trung bình từ 4-5 giây với số lượng chọn 300 Hệ thống nhận dạng thực phẩm FoodAutoManage xây dựng với kiến trúc trình bày Hình 3.6 gồm hai phần Client Server dựa kết nối TC/IP Client tiến hành thu thập ảnh gửi vể để Server tiến hành xử lý, phân đoạn, rút trích đặc trưng, phân loại ảnh trả kết để người dùng lựa chọn 24 KẾT LUẬN Luận văn tập trung vào việc xây dựng hệ thống nhận dạng thực phẩm tươi ứng dụng quản lý chế dộ dinh dưỡng tảng di động với chi phí thấp, độ xác cao, tự động, dễ dùng mang tính cá nhân Hệ thống giúp người dùng quản lý theo dõi chế độ dinh dưỡng hàng ngày, thuận tiện cho trình kiểm soát trọng lượng thể Những liệu hệ thống ghi lại cung cấp thông tin hữu ích cho chuyên gia y tế việc chăm sóc đưa phác đồ điều trị hợp lý cho bệnh nhân Việc xây dựng hệ thống trải qua bước bao gồm tiền xử lý ảnh, phân đoạn ảnh thuật toán K-mean, trích chọn đặc trưng ảnh màu sắc, hình dạng, kết cấu, SURF kết hợp chúng nhằm tạo vector đặc trưng để tiến hành phân loại Chúng tiến hành chạy thử nghiệm hai thuật toán học máy SVM Random Forest tập liệu huấn luyện nhằm đưa đánh giá, so sánh hiệu năng, độ xác chúng nhằm chọn thuật toán tốt để tiến hành xây dựng hệ thống Kết thực nghiệm tập liệu SingleFood cho thấy Random Forest cho kết phân loại cao với độ xác bao phủ đạt tới 95%; thời gian phân loại nhanh với tổng thời gian tính từ lúc ảnh chụp tới có kết phân loại từ – giây Kết khả thi để áp dụng hệ thống vào thực tế Những công việc đòi hỏi có nghiên cứu chuyên sâu lĩnh vực xử lý ảnh, học máy, phân tích, thiết kế xây dựng hệ thống Tuy nhiên hạn chế định mặt thời gian kiến thức thân, luận văn dừng lại mức thử nghiệm hệ thống tập liệu SingleFood với số lượng ảnh khiêm tốn cho việc nhận dạng thực phẩm Trong thời gian tới, tiếp tục tiến hành nghiên cứu thử nghiệm hệ thống với tập liệu MultiFood Chúng tiếp tục tăng số lượng ảnh huấn luyện đưa thêm vào đặc trưng ngữ cảnh để nâng cao độ xác, đồng thời tìm cách giảm số chiều không gian liệu để nâng cao hiệu hướng tới xây dựng hệ thống hoàn chỉnh [...]... loại bằng tay vào hai nhóm chính:  Hình ảnh đơn thực phẩm (SingleFood): mỗi hình ảnh chỉ có một loại thực phẩm duy nhất Các hình ảnh đều đáp ứng được giả định của bài toán nêu ra trong phần 1.5 Số lượng rơi vào khoảng 2000 ảnh  Hình ảnh đa thực phẩm (MultiFood): mỗi hình ảnh có từ 2 loại thực phẩm trở lên.Các hình ảnh đều đáp ứng được giả định của bài toán nêu ra trong phần 1.5 Số lượng khoảng 1000 ảnh. .. và susu được chúng tôi phân loại bằng tay vào 2 nhóm chính là hình ảnh đơn thực phẩm (SingleFood – 2000 ảnh) và hình ảnh đa thực phẩm (MultiFood – 1000 ảnh) Do hạn chế về mặt thời gian, chúng tôi chỉ tiến hành nghiên cứu và thử nghiệm trên tập dữ liệu SingleFood gồm 2039 ảnh được liệt kê chi tiết trong Bảng 3.1 Kết quả thử nghiệm và đánh giá được chúng tôi tiến hành bằng hai thuật toán SVM và Random... thống nhận dạng thực phẩm FoodAutoManage được chúng tôi xây dựng với kiến trúc được trình bày trong Hình 3.6 gồm hai phần chính là Client và Server dựa trên kết nối TC/IP Client tiến hành thu thập ảnh và gửi vể để Server tiến hành xử lý, phân đoạn, rút trích đặc trưng, phân loại ảnh và trả về kết quả để người dùng lựa chọn 24 KẾT LUẬN Luận văn tập trung vào việc xây dựng hệ thống nhận dạng thực phẩm tươi. .. các vector màu sắc, hình dáng và kết cấu để tạo nên bộ vector đặc trưng kết hợp làm đầu vào cho các thuật toán học máy 2.3.3 Đặc trưng hình dạng Hình dạng (shape) được biết đến như một đặc trưng quan trong nhận dạng và phân loại đối tượng trong thế giới thực, mà mục đích là để mã hóa các loạihình học đơn giản như đường thằng theo các hướng khác nhau Kỹ thuật trích xuất đặc trưng hình dạng có thể được... về mặt thời gian thực, vì vậy rừng ngẫu nhiên là thuật toán được chúng tôi lựa chọn để xây dựng hệ thống nhận dạng Các đặc trưng được hệ thống sử dụng trong quá trình phân loại bao gồm màu sắc, SURF, hình dạng và kết cấu 3.3 Hệ thống nhận dạng thực phẩm Chúng tôi tiến hành xây dựng hệ thống FoodAutoManage nhằm quản lý dinh dưỡng cá nhân với kiến trúc được thể hiện trong Hình 3.6 22 Hình 3.6: Kiến trúc... đoán bằng cách sử dụng kết quả số đông của các cây (bỏ phiếu) 15  Thiết lập các tham số Qua việc thực nghiệm, chúng tôi chọn số lượng cây là 300 cho quá trình huấn luyện Số lượng này đảm bảo độ chính xác đủ tốt và thời gian thực thi đủ nhanh 2.5 Quản lý chế độ dinh dưỡng 2.6 Kết luận chương 2 Trong chương này, chúng tôi trình bày bốn bước chính của hệ thống nhận dạng thực phẩm tươi bằng hình ảnh Bước... hệ thống nhận dạng thực phẩm và quản lý dinh dưỡng phù hợp và hiệu quả CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Tập dữ liệu huấn luyện Tập dữ liệu được chúng tôi thu thập từ điện thoại di động (Microsoft Lumia 630, 8MP) ở độ phân giải thấp nhất là 640x480 điểm ảnh, ngoài ra chúng tôi cũng tiến hành thu thập một số hình ảnh trên mạng Tập ảnh thu thập được gồm khoảng 2000-3000 ảnh của 10 loại thực phẩm khác... dò Fast-Hessan và đã được chứng minh tính hiệu quả trong xử lý ảnh mờ (có khả năng rút trích các đặc trưng từ các hình ảnh bị mờ) Hơn nữa, đặc trưng SURF là bất biến với tính chất co giãn và xoay ảnh, những đặc điểm này rất quan trọng trong việc phân loại thực phẩm khi các ảnh thu thập có thể chụp với các góc xoay và khoảng cách khác nhau Hình 2.6: Các điểm nổi bật được phát hiện 11 Thuật toán của SURF... chạy thực nghiệm giữa SVM và Random Forest (%) Từ bảng so sánh trên, chúng tôi thấy rằng thuật toán Random Forest cho kết quả phân loại tốt hơn, đặc biệt là việc nâng cao độ chính xác (Precision) của Cà chua và Khoai tây từ 85% tới trên 97%, đây là hai loại thực phẩm có bộ vector đặc trưng yếu do chúng không có nhiều đặc trưng SURF riêng và hình dạng là tương tự nhau, đặc biệt màu sắc và hình dạng. .. nhiêncủa các thực phẩm tiền chế biến và dễ dàng tính toán, sử dụng Chúng tôi thực hiện trích chọn bảy đặc trưng theo phương pháp này bao gồm Contrast, Homogeneity,Energy và Correlation dựa trên ma trận đồng hiện mức xám (Co-occurrence Maxtrix) Ngoài ra chúng tôi còn thực hiện rút trích các đặc trưng khác là Mean, Variance và Entropy dựa trên biểu đồ thống kê mức xám của ảnh 2.4 Phân loại hình ảnh Từ việc

Ngày đăng: 02/12/2016, 04:48

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan