Nhận dạng thực phẩm tươi bằng hình ảnh

Thông tin tài liệu

Nhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnhNhận dạng thực phẩm tươi bằng hình ảnh

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LƯU TIẾN THÀNH NHẬN DẠNG THỰC PHẨM TƯƠI SỐNG BẰNG HÌNH ẢNH LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI - 2016 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LƯU TIẾN THÀNH NHẬN DẠNG THỰC PHẨM TƯƠI SỐNG BẰNG HÌNH ẢNH CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS PHẠM VĂN CƯỜNG HÀ NỘI - 2016 i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu riêng Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Học viên Lưu Tiến Thành ii LỜI CÁM ƠN Trước tiên, xin gửi lời cảm ơn sâu sắc đến thầy giáo TS Phạm Văn Cường - Khoa Công nghệ thông tin I – Học viện Công nghệ Bưu Chính Viễn Thông Người tận tình hướng dẫn bảo suốt trình thực khóa luận Tôi đồng thời cảm ơn thầy cô Khoa Công nghệ Thông tin I – Học viện Công nghệ Bưu Viễn thông truyền đạt kiến thức bổ ích Tôi xin cảm ơn giúp đỡ thầy cô Khoa Quốc Tế Đào Tạo Sau Đại Học suốt trình học tập làm luận văn Tôi xin chân thành cảm ơn gia đình giúp đỡ để có thời gian hoàn thành khóa luận Cuối cùng, xin chân thành cảm ơn anh chị, bạn bè bạn sinh viên giúp đỡ trình thu thập xử lý liệu Hà Nội, Ngày 06 tháng 06 năm 2016 Học viên Lưu Tiến Thành iii MỤC LỤC MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG THỰC PHẨM 1.1 Bài toán nhận dạng thực phẩm 1.2 Các nghiên cứu trước 1.3 Phương pháp tiếp cận 1.4 Các vấn đề toán nhận dạng ảnh 1.4.1 Các khía cạnh chung toán nhận dạng ảnh 1.4.2 Các khía cạnh riêng toán nhận dạng thực phẩm 10 1.5 Các giả định toán 11 1.6 Phạm vi nghiên cứu 11 1.7 Kết luận chương 12 CHƯƠNG 2: PHƯƠNG PHÁP NHẬN DẠNG THỰC PHẨM 13 2.1 Tiền xử lý ảnh 13 2.2 Phân đoạn ảnh 15 2.3 Trích chọn đặc trưng 18 2.3.1 Đặc trưng màu sắc 18 2.3.2 Đặc trưng SURF 20 2.3.3 Đặc trưng hình dạng 25 2.3.4 Đặc trưng kết cấu 27 2.4 Phân loại hình ảnh 32 2.4.1 Bài toán phân lớp 32 2.4.2 Thuật toán máy hỗ trợ vector (SVM) 33 2.4.3 Thuật toán rừng ngẫu nhiên (Random Forest) 37 2.5 Quản lý chế độ dinh dưỡng 41 2.6 Kết luận chương 41 CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ 43 3.1 Tập liệu huấn luyện 43 3.2 Thử nghiệm đánh giá 43 iv 3.2.1 Thử nghiệm đánh giá thuật toán SVM 46 3.2.2 Thử nghiệm đánh giá thuật toán Random Forest 47 3.2.3 So sánh kết SVM Random Forest 49 3.3 Hệ thống nhận dạng thực phẩm 51 3.4 Kết luận chương 52 KẾT LUẬN 54 DANH MỤC TÀI LIỆU THAM KHẢO 55 v DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Viết tắt BMI DIMA RF SIFT SMO SURF SVM Tiếng Anh Body Mass Index Diabetes Management Assistant Tiếng Việt Chỉ số khối thể Hệ thống hỗ trợ bệnh nhân tiểu đường Random Forest Rừng ngẫu nhiên Scale-invariant feature transform Đặc trưng cục bất biến Sequential Minimal Thuật toán tối thiểu hóa tuần Optimization tự Speeded Up Robust Features Những đặc trưng mạnh Support Vector Machine Máy hỗ trợ vector vi DANH MỤC CÁC BẢNG Bảng 3.1: Tập liệu SingleFood 44 Bảng 3.2: So sánh kết chạy thực nghiệm SVM Random Forest (%) 49 Bảng 3.3: So sánh thời gian chạy thực nghiệm SVM Random Forest (giây) 50 vii DANH MỤC CÁC HÌNH Hình 1.1: Hệ thống hỗ trợ bệnh nhân tiểu đường (DIMA) [17] Hình 1.2: Ứng dụng Nokia Wellness Diary [26] Hình 1.3: Ứng dụng MyFitnessPal [23] Hình 1.4: Giải pháp quản lý dinh dưỡng Hình 2.1: Ảnh không điều chỉnh độ tương phản kết sau phân đoạn 14 Hình 2.2: Ảnh điều chỉnh độ tương phản kết sau phân đoạn 14 Hình 2.3: Kết sau tiến hành phân đoạn K-mean (K = 3) 17 Hình 2.4: Biểu đồ màu RGB 19 Hình 2.5: Xấp xỉ đạo hàm cấp Gaussian hộp lọc [14] .21 Hình 2.6: Các điểm bật phát 22 Hình 2.7: Lọc Haar Wavelet để tính ảnh hưởng hai hướng x y 22 Hình 2.8: Hướng đại diện điểm đặc trưng .23 Hình 2.9: Hình vuông 4x4 quanh điểm đặc trưng 24 Hình 2.10: Các đặc trưng hình dạng phân loại nhận dạng đối tượng 25 Hình 2.11: Ảnh gốc, đa giác lồi Elipse bao quanh đối tượng 26 Hình 2.12: Kết cấu nhân tạo tự nhiên 28 Hình 2.13: Ma trận điểm ảnh gốc, ma trận đồng khởi tạo ma trận đồng mức xám với h1,0° .31 Hình 2.14: Đường thằng tuyến tính H1 (xanh lơ) H2 (đỏ) phân tách hai lớp liệu 34 Hình 2.15: Lề cực đại tính toán SVM tuyến tính 34 Hình 2.16: Kiến trúc chung rừng ngẫu nhiên .38 Hình 3.1: Phương pháp kiểm thử 10-fold cross validation .45 Hình 3.2: Kết Precision chạy thử nghiệm với SVM 46 45 thước xấp xỉ Mỗi lần lặp (trong số 𝒌 lần lặp), tập sử dụng làm tập kiểm thử 𝒌 − 𝟏 tập lại dùng làm tập huấn luyện Giá trị lỗi tổng thể tính trung bình từ 𝒌 giá trị lỗi (mỗi giá trị tương ứng với fold) Chúng chọn tham số 𝒌 = 𝟏𝟎 cho trình thử nghiệm Phương pháp 10-fold cross validation minh họa cụ thể Hình 3.1 Hình 3.1: Phương pháp kiểm thử 10-fold cross validation Kết thử nghiệm gồm độ đo Precision (độ xác) Recall (độ bao phủ) tính toán theo công thức sau: Precision = TP/(TP + FP) Recall = TP/(TP + FN) Trong đó: TP (True Possitive): số lượng ví dụ thuộc lớp 𝐶𝑖 phân loại xác vào lớp 𝐶𝑖 FP (False Possitive): số lượng ví dụ không thuộc lớp 𝐶𝑖 bị phân loại nhầm vào lớp 𝐶𝑖 FN (False Negative): số lượng ví dụ thuộc lớp 𝐶𝑖 bị phân loại nhầm vào lớp khác 𝐶𝑖 46 3.2.1 Thử nghiệm đánh giá thuật toán SVM Chúng sử dụng thuật toán SMO [28] thực thi thư viện LibSVM [9][22] với tham số C = hàm nhân đa thức 𝑲(𝒙, 𝒙′ ) = (𝒙𝑇 𝒙′ + 𝟏)𝑑 ∶ (𝑑 = 1) Kết thu sau : SVM - Precision (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 30 Color + SURF + Shape + Texture 20 10 Cà Cà rốt chua Dứa Dưa Khoai chuột tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.2: Kết Precision chạy thử nghiệm với SVM SVM - Recall (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 30 Color + SURF + Shape + Texture 20 10 Cà Cà rốt chua Dứa Dưa Khoai chuột tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.3: Kết Recall chạy thử nghiệm với SVM 47 Từ kết trên, chúng thấy nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu cho kết phân loại tốt với giá trị trung bình Precision Recall đạt 93% Trong số này, cà chua khoai tây có kêt phân loại với Precision Recall đạt khoảng 80% Màu sắc cà chua tương tự ớt đỏ, hình dạng tương tự khoai tây loại ớt số góc chụp khác nhau, quan trọng đặc trưng SURF chúng không mạnh đặc điểm riêng hình dạng có phần tương tự nhau, điều khiến việc phân loại dễ bị nhầm lẫn Số lại đạt kết cao với Precision Recall đạt 90%, dứa cho kết phân loại cao chúng có đặc trưng riêng biệt hình dạng khiến đặc trưng SURF chúng mạnh loại thực phẩm khác 3.2.2 Thử nghiệm đánh giá thuật toán Random Forest Chúng chọn số lượng 300 cho trình phân loại, giá trị chọn trình thực nghiệm cách thay đổi liên tục giá trị trình phân loại chọn kết tốt Kết thu sau: Random Forest - Precision (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 Color + SURF + Shape + Texture 30 20 10 Cà Cà rốt Dứa chua Dưa Khoai Khổ chuột tây qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.4: Kết Precision chạy thử nghiệm với Random Forest 48 Random Forest - Recall (%) 100 90 80 70 Color + SURF 60 50 Color + SURF + Shape 40 Color + SURF + Shape + Texture 30 20 10 Cà Cà rốt chua Dứa Dưa Khoai chuột tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Hình 3.5: Kết Recall chạy thử nghiệm với Random Forest Thuật toán rừng ngẫu nhiên cho kết phân loại tốt với nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu Giá trị trung bình Precision Recall đạt 95% Kết thấp nằm hai loại cà chua khoai tây, với giá trị Recall tương ứng 88% 75%; đặc trưng SURF hình dạng chúng tương tự nên chúng dễ bị phân loại nhầm vào lớp khác ngược lại, nhiên độ xác (Precision) chúng cải thiện đáng kể với kết đạt 90% Các đặc trưng phân loại dứa mạnh với đặc trưng hình dạng, màu sắc, kết cấu SURF hoàn toàn riêng biệt, điều khiến khả bị phân loại nhầm chúng khó xảy ra, kết thu cao lên tới 100% Nhóm đặc trưng thứ bao gồm màu sắc SURF cho kết phân loại Nhóm đặc trưng thứ hai gồm màu sắc, SURF hình dạng cho kết phân loại cao hơn, cuối nhóm đặc trưng thứ ba cho kết phân loại tốt Điều cho tầm quan trọng đặc trưng hình dạng kết cấu việc nâng cao độ xác toán 49 3.2.3 So sánh kết SVM Random Forest Từ việc thử nghiệm hai thuật toán, thấy nhóm đặc trưng thứ ba bao gồm màu sắc, SURF, hình dạng kết cấu cho kết tốt Chúng tiến hành so sánh hai thuật toán dựa kết nhóm đặc trưng Kết so sánh trình bày Bảng 3.2 sau: Độ đo Precision Recall Loại thực phẩm SVM RF SVM RF Cà chua Dứa Dưa chuột Khoai tây Khổ qua Ớt đỏ Ớt vàng Ớt xanh Susu Trung bình 85.4 95.1 92 82.5 95.8 94.7 95.4 98.6 95.5 93.6 97.9 97 95.9 100 93 93.1 91.3 96.9 96.9 95.3 87.5 99 94.7 77.6 95.4 94.7 94.3 95 93.9 93.6 88.1 99.5 96.5 75.4 98.9 97.3 99.6 98.6 87.3 95.1 Bảng 3.2: So sánh kết chạy thực nghiệm SVM Random Forest (%) Từ bảng so sánh trên, thấy thuật toán Random Forest cho kết phân loại tốt hơn, đặc biệt việc nâng cao độ xác (Precision) Cà chua Khoai tây từ 85% tới 97%, hai loại thực phẩm có vector đặc trưng yếu chúng nhiều đặc trưng SURF riêng hình dạng tương tự nhau, đặc biệt màu sắc hình dạng cà chua tương tự ớt đỏ số góc chụp khác Những yếu tố làm tăng khả khiến việc chúng bị phân loại nhầm vào lớp khác ví dụ thuộc lớp khác bị phân loại nhầm vào lớp chúng Tuy nhiên thuật toán Random Forest cải tiến đáng kể độ xác nhờ việc tiến hành dự đoán dựa kết số đông (bỏ phiếu) Chúng thấy đặc trưng SURF đóng vai trò chủ chốt việc tính toán độ xác phản hồi hai thuật toán Điều nhìn thấy dễ dàng qua kết phân loại Dứa, khổ qua loại ớt; chúng chứa đặc trưng SURF mạnh 50 Ngoài trình nghiên cứu, tiến hành chạy thử nghiệm hai thuật toán hệ thống thực tế để so sánh hiệu thực Chúng sử dụng Matlab R2016a (Image Processing Toolbox, Statistic Toolbox) để thực trình xử lý ảnh, phân đoạn, rút trích đặc trưng, huấn luyện nhận dạng Kết huấn luyện lưu vào tập tin nhị phân, trình phân loại liệu huấn luyện đọc từ tập tin nhị phân nhằm giảm chi phí mặt thời gian nhớ Bỏ qua khía cạnh nhớ lưu trữ hệ thống, xem xét hiệu mặt thời gian Thời gian chạy thực tế tính từ lúc ảnh thu thập có kết phân loại Kết thử nghiệm 10 loại thực phẩm khác trình bày Bảng 3.3 Qua việc so sánh độ xác hiệu năng, thấy thuật toán rừng ngẫu nhiên cho kết phân loại cao hiệu tốt mặt thời gian thực, rừng ngẫu nhiên thuật toán lựa chọn để xây dựng hệ thống nhận dạng Các đặc trưng hệ thống sử dụng trình phân loại bao gồm màu sắc, SURF, hình dạng kết cấu Thuật toán Lần chạy SVM RF Lần 7.5 5.3 Lần 6.9 4.6 Lần 7.2 4.2 Lần 6.8 4.4 Lần 6.9 4.4 Lần 7.0 5.5 Lần 6.5 4.2 Lần 6.6 4.4 Lần 6.9 4.6 Lần 10 6.7 4.1 Trung bình 6.9 4.57 Bảng 3.3: So sánh thời chạy thực nghiệm SVM Random Forest (giây) 51 3.3 Hệ thống nhận dạng thực phẩm Chúng tiến hành xây dựng hệ thống FoodAutoManage nhằm quản lý dinh dưỡng cá nhân với kiến trúc thể Hình 3.6 Hình 3.6: Kiến trúc hệ thống FoodAutoManage Hệ thống chia làm hai phần bao gồm Client Server Do giới hạn mặt thời gian công nghệ, tiến hành xây dựng hệ thống dựa kết nối TCP/IP thiết bị có sẵn  Client: xây dựng tảng di động Windows 10 (Microsoft Lumia 650) dựa ngôn ngữ C# Client bao gồm hai module Input Output Input module cho phép người dùng thu thập ảnh từ camera hình ảnh có sẵn thiết bị, sau ảnh gửi tới Server để tiến hành xử lý Input module đồng thời tiến hành thu thập liệu nhằm ghi log hoạt động người dùng, điều khiến việc quản lý dinh dưỡng dễ dàng hơn, chuyên gia y tế dựa vào liệu để đưa dự đoán phác đồ điều trị dễ dàng Output module cho phép Client hiển thị thông tin kết trả từ Server, hiển thị thực phẩm người dùng lựa chọn, hiển thị danh sách log 52  Server: xây dựng tảng PC Windows 10, ngôn ngữ C# Matlab Việc kết nối truyền liệu Client Server thực thông qua kết nối không dây TCP/IP, liệu truyền hình ảnh, liệu người dùng thu thập từ phía Client thông tin phục vụ việc kết nối Module Server FoodRecognition thực ngôn ngữ Matlab (Matlab R2016a - Image Processing Toolbox, Statistic Toolbox), sau nhận ảnh từ phía Client, Server tiến hành điều chỉnh kích thước ảnh (300x300) nhằm giảm dung lượng tăng tốc thuật toán, sau ảnh tiến hành loại bỏ nhiễu nâng cao chất lượng ảnh Tiếp theo thuật toán phân cụm K-mean áp dụng nhằm loại bỏ phông nền, việc rút trích đặc trưng tiếp tục tiến hành nhằm thu vector đặc trưng bao gồm màu sắc, SURF, hình dạng kết cấu Các vector đầu vào thuật toán học máy Random Forest lựa chọn nhằm phân loại ảnh Sau phân loại thành công, Server gửi thông tin Client nhằm tính toán lượng calo hiển thị để người dùng lựa chọn thao tác Như trình bày phần 3.2.3, độ xác hệ thống rơi vào khoảng 95% Thời gian chạy phiên tính từ lúc ảnh chụp chọn từ phía Client nhằm gửi tới Server tới Server phản hồi kết hiển thị Client, thời gian trung bình phiên rơi vào khoảng - giây Những kết khả thi để áp dụng hệ thống vào thực tế 3.4 Kết luận chương Trong chương này, nêu cách thức thu thập liệu huấn luyện sử dụng máy ảnh điện thoại di động (Microsoft Lumia 650, 8MP) độ phân giải thấp (640x480 pixel) Tập ảnh thu gồm khoảng 2000 tới 3000 ảnh 10 loại thực phẩm khác bao gồm: cà chua, cà rốt, dứa, dưa chuột, khoai tây, khổ qua, ớt đỏ, ớt vàng, ớt xanh susu phân loại tay vào nhóm 53 hình ảnh đơn thực phẩm (SingleFood – 2000 ảnh) hình ảnh đa thực phẩm (MultiFood – 1000 ảnh) Do hạn chế mặt thời gian, tiến hành nghiên cứu thử nghiệm tập liệu SingleFood gồm 2039 ảnh liệt kê chi tiết Bảng 3.1 Kết thử nghiệm đánh giá tiến hành hai thuật toán SVM Random Forest tập vector đặc trưng chia thành nhóm huấn luyện (nhóm thứ gồm Color + SURF, nhóm thứ hai gồm Color + SURF + Shape nhóm thứ ba gồm Color + SURF + Share + Texture) Chúng sử dụng phương pháp kiểm thử 10 – fold cross validation để tránh việc trùng lặp tập kiểm thử Kết thu cho thấy Random Forest cho kết phân loại tốt nhóm huấn luyện thứ ba với kết độ xác bao phủ trung bình đạt 95%, thời gian phân loại trung bình từ 4-5 giây với số lượng chọn 300 Phương pháp huấn luyện nhận dạng mà sử dụng độc lập khác biệt so với nghiên cứu nhận dạng thực phẩm tươi sống trước tác giả Cuong Pham [10] nêu Chúng thực huấn luyện, đánh giá nhận dạng thuật toán học máy SVM Random Forest nghiên cứu trước sử dụng phương pháp so khớp đặc trưng kết hợp kết so khớp sử dụng phương pháp đếm Borda [10] Hệ thống nhận dạng thực phẩm FoodAutoManage xây dựng với kiến trúc trình bày Hình 3.6 gồm hai phần Client Server dựa kết nối TC/IP Client tiến hành thu thập ảnh gửi vể để Server tiến hành xử lý, phân đoạn, rút trích đặc trưng, phân loại ảnh trả kết để người dùng lựa chọn 54 KẾT LUẬN Luận văn tập trung vào việc xây dựng hệ thống nhận dạng thực phẩm tươi ứng dụng quản lý chế dộ dinh dưỡng tảng di động với chi phí thấp, độ xác cao, tự động, dễ dùng mang tính cá nhân Hệ thống giúp người dùng quản lý theo dõi chế độ dinh dưỡng hàng ngày, thuận tiện cho trình kiểm soát trọng lượng thể Những liệu hệ thống ghi lại cung cấp thông tin hữu ích cho chuyên gia y tế việc chăm sóc đưa phác đồ điều trị hợp lý cho bệnh nhân Việc xây dựng hệ thống trải qua bước bao gồm tiền xử lý ảnh, phân đoạn ảnh thuật toán K-mean, trích chọn đặc trưng ảnh màu sắc, hình dạng, kết cấu, SURF kết hợp chúng nhằm tạo vector đặc trưng để tiến hành phân loại Chúng tiến hành chạy thử nghiệm hai thuật toán học máy SVM Random Forest tập liệu huấn luyện nhằm đưa đánh giá, so sánh hiệu năng, độ xác chúng nhằm chọn thuật toán tốt để tiến hành xây dựng hệ thống Kết thực nghiệm tập liệu SingleFood cho thấy Random Forest cho kết phân loại cao với độ xác bao phủ đạt tới 95%; thời gian phân loại nhanh với tổng thời gian tính từ lúc ảnh chụp tới có kết phân loại từ – giây Kết khả thi để áp dụng hệ thống vào thực tế Chúng tiến hành tham khảo phương pháp phân đoạn, rút trích đặc trưng phân loại ảnh nghiên cứu nhận dạng thực phẩm tươi sống trước [10] nhằm đưa giải pháp thích hợp Chúng sử dụng lại phương pháp phân đoạn ảnh không gian màu RGB thuật toán K-Mean tác giả, phương pháp rút trích đặc trưng, huấn luyện nhận dạng độc lập khác biệt Những công việc đòi hỏi có nghiên cứu chuyên sâu lĩnh vực xử lý ảnh, học máy, phân tích, thiết kế xây dựng hệ thống Tuy nhiên hạn chế định mặt thời gian kiến thức thân, luận văn 55 dừng lại mức thử nghiệm hệ thống tập liệu SingleFood với số lượng ảnh khiêm tốn cho việc nhận dạng thực phẩm Trong thời gian tới, tiếp tục tiến hành nghiên cứu thử nghiệm hệ thống với tập liệu MultiFood Chúng tiếp tục tăng số lượng ảnh huấn luyện đưa thêm vào đặc trưng ngữ cảnh để nâng cao độ xác, đồng thời tìm cách giảm số chiều không gian liệu để nâng cao hiệu hướng tới xây dựng hệ thống hoàn chỉnh DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt: [1] Bộ Y Tế - Việt Nam tỷ lệ người trường thành bị thừa cân, béo phì chiếm khoảng 25% dân số, http://moh.gov.vn:8086/news/Pages/ChuongTrinhMucTieuQuocGiaYTe.asp x?ItemID=1740, truy nhập ngày 28/3/2016 [2] Nguyễn Công Khẩn (2007), “Bảng thành phần thực phẩm Việt Nam, Viện Dinh Dưỡng - Bộ Y Tế”, NHÀ XUẤT BẢN Y HỌC Tài liệu tiếng Anh: [3] American Heart Association 2013 report: www.heart.org/idc/groups/heartpublic/@wcm/@sop/@smd/documents/downloadable/ucm_319588.pdf, accessed on March 28, 2016 [4] A Materka, M Strzelecki (1998), Texture Analysis Methods – A Review, Technical University of Lodz, Institute of Electronics, COST B11 report, Brussels [5] A Smailagic and D Siewiorek (2002), “DIMA: Diabetes Management Assistant Wearable Computer”, Wearable Computing, IEEE Pervasive Computing Vol.1, No 4, pp.71-73 56 [6] Benjamin J Balas (2006), “Texture synthesis and perception: Using computational models to study texture representations in the human visual system” Vision Research, Vol 46, No 3, pp.299-309 [7] Breiman, Leo (2001) “Random Forests” Machine Learning, pp.5–32 [8] C Cheng, W Liu, and H Zhang (2001), “Image retrieval based on region shape similarity” Photonics West 2001 – Electronic Imaging, pp.31-38 [9] Chang, Chih-Chung; Lin, Chih-Jen (2011) “LIBSVM: A library for support vector machines” ACM Transactions on Intelligent Systems and Technology, Vol 2, No 3, pp.27 [10] Cuong Pham, Thuy Nguyen Thi Thanh (2014) “Fresh food recognition using feature fusion” Advanced Technologies for Communications (ATC), 2014 International Conference on [11] D Zhang and G Lu (2004), “Review of shape representation and description techniques”, Pattern Recognition, Vol 37, No 1, pp 1-19 [12] F Takeda; K Kumada, and M Takara (2003, July), “Dish extraction method with neural network for food intake measuring system on medical use”, Computational Intelligence for Measurement Systems and Applications, pp.56 – 59 [13] Kohavi, Ron (1995) "A study of cross-validation and bootstrap for accuracy estimation and model selection".Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence (San Mateo, CA: Morgan Kaufmann) pp 1137–1143 [14] H Bay, A Ess, T Tuytelaars, L.V Gool (2008), “SURF - Speeded Up Robust Features”, Computer Vision and Image Understanding (CVIU), Vol 110, No 3, pp 346–359 [15] Hui Yu, Mingjing Li, Hong-Jiang Zhang, Jufu Feng (2002, Sep) "Color Texture Moments for Content-Based Image Retrieval" Proc IEEE Intl Conf on Image Processing, pp 929-932 [16] I.H Rosenberg (1996), Nutrition Research: an Invention in the Nation’s 57 Health, Nutrition Review, pp.54 [17] I.Dana Hilinski Clements (2006), “Institute for Complex Engineered Systems, Carnege Mellon University”, iNews magazine - Carnege Mellon University, pp [18] K.H Chang, S.Y Liu, H.H Chu, J.Y.J Hsu, C Cheryl, T.Y Lin, C.Y Chen, and P Huang (2006), “The diet-aware dining table: observing dietary behaviors over a tabletop surface”, Proceedings of the 4th International Conference on Pervasive Computing, pp 366-382 [19] K Kitamura, T Yamasaki, and K Aizawa (2009), “Food Log: capture, analysis and retrieval of personal food images via web”, in In Proceedings of ACM Multimedia Workshop Multimedia for Cooking and Eating Activities (CEA’09), ACM, New York, NY, USA, pp 23-30 [20] K.M Lee (2007), “Effects of Classification Methods on Color-Based Feature Detection with Food Processing Applications”, IEEE Transactions of Automation Science and Engineering Jan Vol.1, pp 40-51 [21] Lou, S.; Jiang, X.; Scott, P.J (2012) “Algorithms for morphological profile filters and their comparison” Precision Engineering, Vol 36, No 3, pp 414423 [22] Luca Zanni (2006) “Parallel Software for Training Large Scale Support Vector Machines on Multiprocessor Systems” Journal of Machine Learning Research, Vol.7, pp 1467-1492 [23] MyFitnessPal, Inc Calorie Counter – MyFitnesPal, https://play.google.com/store/apps/details?id=com.myfitnesspal.android&hl= en, accessed on March 28, 2016 [24] National Health Services: http://www.nhs.uk/news/2013/08August/Pages/new-US-estimates-linkobesity-to-18-per-cent-of-deaths.aspx, accessed on March 28, 2016 [25] Nbhan D Salih , David Chek Ling Ngo (2005, December), “A novel method for shape representation”, GVIP 05 Conference, CICC, Cairo, Egypt 58 [26] Nokia Beta Lab WellnessDiary, http://research.nokia.com/research/projects/WellnessDiary/index.html, accessed on Jan, 2016 [27] P Viola, M Jones (2001), “Rapid object detection using a boosted cascade of simple features”, Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Vol 1, pp 511518 [28] Platt, John (1998), “Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines” Mirosoft Research, Technical Report MSR-TR-98-14 [29] Press, William H.; Teukolsky, Saul A.; Vetterling, William T.; Flannery, B P (2007) “Section 16.5 Support Vector Machines” Numerical Recipes: The Art of Scientific Computing New York: Cambridge University Press ISBN 978-0-521-88068-8 [30] R M HARALICK, (1979) “Statistical and structural approaches to texture”, Proc IEEE, pp 786-804 [31] Ryuji Funayama, Hiromichi Yanagihara, Luc Van Gool, Tinne Tuytelaars, Herbert Bay (2009), “ROBUST INTEREST POINT DETECTOR AND DESCRIPTOR” Patent Number : US8165401 B2 [32] Shapiro, Linda G and Stockman, George C (2003) “Computer Vision” Prentice Hall, ISBN 0-13-030796-3 [33] T Aono, H Kimura, Y Yamauchi (2002), “A food recognition algorithm based on dish recognition”, 28th Annual Conference of the Industrial Electronics Society, IEEE 2002, Vol.2, pp 1445 – 1450 [34] Trambitskiy K.V., Anding K., Polte G.A., Garten D., Musalimov V.M (2015) “Out-of-focus region segmentation of 2D surface images with the use of texture features” Scientific and Technical Journal of Information Technologies, Mechanics and Optics 15, pp.796–802 [35] W Wu and L Yang (2009), “Fast food recognition from videos of eating for 59 calorie estimation”, in Proceedings of the 2009 IEEE International Conference on Multimedia and Expo (ICME'09) IEEE Computer Society, Piscataway, NJ, USA, pp 1210-1213 [36] World Health Statistics 2015: http://apps.who.int/iris/bitstream/10665/170250/1/9789240694439_eng.pdf, pp 109, accessed on March 28, 2016 [37] Xiaoyin Duanmu (2010) "Image Retrieval Using Color Moment Invariant" Seventh International Conference on Information Technology, pp 200-203 [38] X Shroff, A Smailagic, and D Siewiorek (2008) “Wearable context-aware food recognition for calorie monitoring”, IEEE International Symposium on Wearable Computers, pp 119-120 [39] Y Bolle, J Connell, N Haas, R Mohan, and G Taubin (1996) VeggieVision: A produce recognition system Applications of Computer Vision, WACV’96, pp 244-251 [40] Y Wu, M Chen, K Dhingra, L Yang, R Sukthankar, and J Yang (2009) PFID: Pittsburgh fast-food image dataset Proceedings of the 16th IEEE international conference on Image processing, pp 289-292 [...]... toán nhận dạng thực phẩm  Vị trí thực phẩm: Thứ tự hình ảnh đứng trước, đứng sau, hay chỉ thấy được một góc của thực phẩm Việc này làm tăng tính phức tạp trong việc xác nhận hình ảnh thực của mỗi loại thực phẩm có trong hình  Sự đa dạng về hình dạng: Không phải tất cả các loại thực phẩm sẽ có hình dạng giống nhau cho mỗi lần chụp Mỗi bức ảnh tuy chụp cùng một khung cảnh nhưng sẽ cho các hình dạng khác... nhận dạng thực phẩm nấu chín [33][19][18] hoặc thực phẩm ăn liền [19][35] Trong khi đó việc nhận dạng thực phẩm tươi sống ít được quan tâm hơn Một nghiên cứu gần đây của tác giả Cuong Pham [10] đưa ra một hệ thống nhận dạng thực phẩm tươi sống dựa trên việc kết hợp các đặc trưng của hình ảnh được chụp từ thiết bị quang học tích hợp trong bề mặt thớt, nghiên cứu sử dụng các đặc trưng màu sắc, hình dạng. .. tìm kiếm giải pháp tốt nhất cho hệ thống Hình 1.4: Giải pháp quản lý dinh dưỡng 1.4 Các vấn đề của bài toán nhận dạng ảnh Việc nhận dạng thực phẩm dựa trên hình ảnh rất phức tạp và có nhiều khía cạnh cần được xem xét hoặc bỏ qua Một số khía cạnh cần được xem xét như sau 1.4.1 Các khía cạnh chung của bài toán nhận dạng ảnh  Sự co giãn hình ảnh: Hình ảnh thực phẩm có thể được chụp từ các khoảng cách... loại thực phẩm Thực tế cùng một loại thực phẩm cũng có nhiều hình dạng khác nhau  Sự thay đổi trong kết cấu hình ảnh: Điều kiện ánh sáng và điều kiện bảo quản có thể thay đổi kết cấu của thực phẩm  Sự chồng chéo: các loại thực phẩm bị sắp xếp chồng chéo đè lên nhau, một 11 số bị che lấp gây khó khăn và sai lệch cho việc nhận dạng  Bối cảnh lộn xộn: thực phẩm có thể được chụp trong các bối cảnh khác... cách này tạo cho người xem một cảm nhận thiếu chính xác về kích thước thực sự của các thực phẩm trong hình Và khó phân biệt luợng thực phẩm là đủ dùng, thiếu hay thừa  Sự xoay ảnh: Hình ảnh được chụp tại cùng khoảng cách với các góc xoay khác nhau cần được xem xét Các góc xoay này tạo cho người xem cảm giác sai lệch về hình dạng của thực phẩm 10  Hướng chụp: Khi thực phẩm được chụp ở các góc khác nhau,... lượng của các loại thực phẩm cụ thể [20] Một trong những thuật toán nhận dạng thực phẩm dựa trên việc nhận dạng hộp đựng thức ăn đã được phát triển nhằm mục đích điều chỉnh cài đặt lò vi sóng theo thức ăn trong hộp với các quy tắc được xác định trước về vị trí của các loại thực phẩm trong hộp, các loại thực phẩm được gán với các vị trí cụ thể trong hộp, gọi là bản đồ sắp xếp thực phẩm [33] Tuy nhiên... chính xác để chọn ra thuật toán tốt nhất và dựa trên đó để xây dựng hệ thống nhận dạng và ứng dụng CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG THỰC PHẨM Trong chương này chúng tôi nói về bài toán nhận dạng thực phẩm và sự cần thiết phải xây dựng bài toán, một số các nghiên cứu trước đây và sự hạn chế của những bài toán nhận dạng thực phẩm đó nhằm tìm ra phương pháp tiếp cận phù hợp, chúng tôi cũng đưa ra... việc nhận dạng thực phẩm ở giai đoạn tiền chế biến nhằm giúp người dùng chủ động hơn trong việc lựa thực phẩm Chúng tôi cố gắng thu hẹp khoảng cách giữa sức khỏe cá nhân, công nghệ và người sử dụng bằng hệ thống được đề xuất trong Hình 1.4 Hệ thống sẽ thực hiện tiền xử lý, phân đoạn, rút trích đặc trưng và phân loại ảnh nhằm tính toán lượng calor cần thiết cho người sử dụng Việc nhận dạng thực phẩm. .. này, chúng tôi chỉ dừng lại ở việc nhận dạng các loại rau, củ, quả trong giai đoạn tiền chế biến với số lượng từ 8 tới 12 loại Tập dữ liệu dùng để nhận dạng là các hình ảnh được thu thập bằng điện thoại di động ở độ phân giải thấp với số lượng từ 2000 tới 3000 ảnh 1.7 Kết luận chương 1 Trong chương này, chúng tôi trình bày tổng quan về bài toán nhận dạng thực phẩm, thực trạng của bệnh thừa cân, béo... cần thiết cho người sử dụng Việc nhận dạng thực phẩm dựa trên hình ảnh rất phức tạp và có nhiều khía cạnh cần được xem xét hoặc bỏ qua Chúng tôi trình bày các khía cạnh chung của bài toán nhận dạng ảnh, các khía cạnh riêng của bài toán nhận dạng thực phẩm; dựa trên 13 các vấn đề này, chúng tôi đưa ra các giả định cho bài toán nhận dạng thực phẩm trong nghiên cứu của chúng tôi Chúng tôi cũng giới hạn

Ngày đăng: 02/12/2016, 04:48

Xem thêm: Nhận dạng thực phẩm tươi bằng hình ảnh, Nhận dạng thực phẩm tươi bằng hình ảnh

Nhận dạng thực phẩm tươi bằng hình ảnh

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan