TÌM HIỂU CHUYỂN NGỮ NGHĨA BỐI CẢNH TRÊN NGUỒN KHÔNGĐỒNG NHẤT CHO TÌM KIẾM VIDEO TƯƠNG ỨNG

27 364 0
TÌM HIỂU CHUYỂN NGỮ NGHĨA BỐI CẢNH TRÊN NGUỒN KHÔNGĐỒNG NHẤT CHO TÌM KIẾM VIDEO TƯƠNG ỨNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN _ BÀI TẬP LỚN CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN Đề tài: TÌM HIỂU CHUYỂN NGỮ NGHĨA BỐI CẢNH TRÊN NGUỒN KHÔNG ĐỒNG NHẤT CHO TÌM KIẾM VIDEO TƯƠNG ỨNG Sinh viên thực hiện: Trịnh Xuân Hinh Trần Hậu Tin Phạm Văn Thành Nhóm Lớp KHMT1-K4 Giảng viên hướng dẫn: Ths Nguyễn Hương Lan Hà Nội, 5/2013 MỤC LỤC LỜI NÓI ĐẦU Tìm kiếm video tự động dựa phát khái niệm ngữ nghĩa gần nhận ý đáng kể Vì số lượng máy dò có sẵn nhỏ so với kích thước ngôn ngữ người nhiều, thách thức lớn lựa chọn thích hợp để phát truy vấn người dùng phản ứng Trong báo này, đề xuất phương pháp thúc đẩy nguồn tri thức không đồng cho miền tìm kiếm video thích nghi Đầu tiên, thay sử dụng WordNet công trình có hầu hết, khai thác thông tin ngữ cảnh kết hợp với hình ảnh Flickr để ước lượng truy vấn tương tự phát Kết đo đạc, tên Flickr bối cảnh tương tự (FCS), phản ánh số liệu thống kê xuất đồng thời từ bối cảnh hình ảnh ngữ liệu văn Bắt đầu từ máy dò ban đầu thiết lập xác định FCS, cách tiếp cận novelly chuyển bối cảnh ngữ nghĩa học từ miền thử nghiệm liệu để thích nghi tinh chỉnh truy vấn tương tự máy dò Bối cảnh ngữ nghĩa xuyên fer trình cung cấp phương tiện hiệu để đối phó với thay đổi miền nguồn kiến thức bên (ví dụ, Flickr ngữ cảnh) liệu thử nghiệm, mà vấn đề quan trọng tìm kiếm video Với hiểu biết chúng tôi, công việc đại diện cho nghiên cứu nhằm giải vấn đề thách thức thay đổi tên miền tìm kiếm video Thí nghiệm rộng rãi 120 truy vấn văn TRECVID 2005-2008 tập hợp liệu chứng minh tính hiệu chuyển bối cảnh ngữ nghĩa cho miền tìm kiếm video thích nghi Kết cho thấy FCS phù hợp để đo truy vấn tương tự dò, sản xuất hiệu suất tốt để biện pháp phổ biến khác Trang I GIỚI THIỆU Thúc đẩy số lượng ngày tăng video tích lũy từ loạt ứng dụng, có nhu cầu phát triển hệ thống tự động để tìm kiếm nội dung có hiệu hiệu Khác từ tài liệu văn bản, từ thực thể tự nhiên để tìm kiếm ngữ nghĩa, đoạn video truyền đạt ý nghĩa ngữ nghĩa hỗn hợp khó khăn cho máy tính để nhận ra, ví dụ, có khoảng cách ngữ nghĩa biết đến tính cấp thấp tính toán ngữ nghĩa mức độ cao Tiến gần nghiên cứu đa phương tiện cho thấy tiến đáng khích lệ việc sử dụng tập hợp mô tả trung gian, phát khái niệm cụ thể ngữ nghĩa, thu hẹp khoảng cách ngữ nghĩa Các máy dò phân loại tự động mục nội dung video với khái niệm ngữ nghĩa chung chung, chẳng hạn nước Việc lập mục khái niệm cho phép người dùng truy cập vào sở liệu video cách truy vấn văn Trong trình tìm kiếm, video clip có nhiều khả chứa khái niệm ngữ nghĩa liên quan đến từ truy vấn trả cho người sử dụng Kịch hồi video gọi chung dựa khái niệm tìm kiếm video Tuy nhiên, thiếu đào tạo tay dán nhãn mẫu giới hạn nguồn tài nguyên tính toán,số lượng phát khái niệm có sẵn quy mô hàng trăm, mà nhỏ nhiều so với kích thước ngôn ngữ người Vì vậy, vấn đề mở sở phương pháp tìm kiếm lựa chọn máy dò thích hợp cho truy vấn, đặc biệt kết hợp trực tiếp từ thất bại Ví dụ, cho truy vấn tìm thấy ảnh đốt cháy với lửa nhìn thấy, cháy nổ khói phát phù hợp Đặc biệt, tìm kiếm video quy mô lớn mà thể loại liệu thử nghiệm thay đổi thời gian, mục tiêu đặc điểm liệu tên miền cần xem xét trình lựa chọn dò Ví dụ, máy dò quân đội liên quan nhiều đến truy tìm thấy ảnh phương tiện việc tìm kiếm tin tức phát sóng lưu trữ video nhiều kiện tin tức chiến tranh (và video hiển thị xe quân sự) Trung Đông,, mối quan hệ không giữ video tài liệu Điều mang lại câu hỏi đầy thách thức: làm để thích nghi chọn dò khái niệm dựa liệu tên miền mục tiêu? Bài viết đề xuất phương pháp mà chuyển bối cảnh ngữ nghĩa nguồn không đồng cho miền tìm kiếm video tương ứng Ở bối cảnh ngữ nghĩa truy vấn máy dò tương tự dò cặp tương tự, suy từ nguồn kiến thức khác Khác từ tác phẩm có hầu hết kỹ Trang thuật lý luận ngữ nghĩa dựa WordNet sử dụng để lựa chọn máy dò[27, 20, 19], khám phá thông tin ngữ cảnh gắn liền với hình ảnh Flickr cho truy vấn máy dò tương tự ước lượng tốt Hình 1: Kiến trúc hệ thống cho tên miền tìm kiếm video thích nghi, minh họa sử dụng truy vấn từ TRECVID 2007.Điểm giống ngữ cảnh Flickr thứ áp dụng cho chọn thiết lập máy dò liên quan, sau thích nghi hoàn thiện qua chuyển bối cảnh ngữ nghĩa học từ miền liệu mục tiêu Năng suất tìm kiếm mặt xác trung bình top 10 ảnh chụp đoạn video cải thiện 164% sau thích ứng miền Danh sách thứ hạng video chụp được xếp từ trái sang phải xuống (false positives “khi người dùng quyền truy cập truy cập vào hệ thống gọi false positive” đánh dấu hộp màu đỏ) Đo lường này, đặt tên Flickr bối cảnh tương tự (FCS), số liệu thống kê xuất đồng thời hai từ bối cảnh hình ảnh (ví dụ, thẻ, tiêu đề, mô tả vv), phản ánh đồng thời từ bối cảnh hình ảnh văn ngữ liệu Lợi FCS cho phép lựa chọn thích hợp máy dò để tìm kiếm liệu hình ảnh video Ví dụ, hai từ Cầu Sân vận động có liên quan ngữ nghĩa cao WordNet, hai gần với xây dựng tổ tiên chung hệ thống phân cấp WordNet Tuy nhiên, người dùng nâng mức truy vấn tìm ảnh cầu, sân vận động rõ ràng phát hữu ích xuất với cầu hình ảnh / video Trong cho truy vấn, FCS đề nghị máy dò phù hợp Sông (x Phần 3) Để đối phó với thay đổi miền nguồn kiến thức bên (ví dụ, Flickr ngữ cảnh) liệu thử nghiệm, đề xuất thuật toán mà hiệu lọc ban đầu lựa chọn phát dựa ngữ nghĩa bối cảnh học từ miền liệu mục Trang tiêu Chúng xây dựng vấn đề trình chuyển bối cảnh ngữ nghĩa sử dụng kỹ thuật theo quy tắc đa dạng Một nguyên tắc xây dựng máy dò lựa chọn phải phù hợp với mục tiêu đặc điểm liệu tên miền Phương pháp chung chung theo nghĩa có khả học tập kiến thức miền mục tiêu mà không cần dẫn thích thêm Hình sử dụng truy vấn từ TRECVID 2007 điểm chuẩn để minh hoạ thêm thích ứng khung tìm kiếm video miền đề xuất Cho truy vấn tìm thấy ảnh với người xe đạp, máy dò khái niệm sau {xe đạp, người, bộ, Chạy, ngựa, chó, giao thông} bắt đầu lựa chọn FCS từ hồ bơi máy dò quy định LSCOM [18] Mặc dù thấy hầu hết máy dò lựa chọn phù hợp, vài số không phù hợp với ý nghĩa tổng thể truy vấn này, chẳng hạn ngựa chó (được lựa chọn lời truy vấn tương ứng cưỡi tương ứng) Thông qua chuyển ngữ cảnh ngữ nghĩa tự động học từ liệu thử nghiệm, phương pháp tiếp cận đảm bảo tính quán ngữ nghĩa máy dò lựa chọn Như thể hình 1, loại bỏ thành công khái niệm ngựa chó, đồng thời bổ sung thêm phát ban ngày trời vào thiết lập tinh tế thường xuyên xuất với hầu hết khái niệm lựa chọn theo thử nghiệm miền bối cảnh ngữ nghĩa Quá trình thích ứng cải thiện đáng kể hiệu suất tìm kiếm 164% độ xác trung bình top 10 ảnh phim xếp hạng II CÔNG VIỆC LIÊN QUAN Hệ thống tìm kiếm video truyền thống thường chiết xuất tính cấp thấp cho phù hợp với trực tiếp với người sử dụng truy vấn [26] Cách tiếp cận thường xuyên phải đối mặt với khó khăn việc xử lý truy vấn ngữ nghĩa tồn khoảng cách ngữ nghĩa Gần đây, dựa khái niệm tìm kiếm video đề xuất cách tổng hợp tập hợp máy dò ngữ nghĩa trước đào tạo để thu hẹp khoảng cách ngữ nghĩa Các khái niệm ngữ nghĩa bao gồm loạt chủ đề, chẳng hạn đối tượng (ví dụ, ô tô xe đạp), cảnh (ví dụ, núi sa mạc), kiện (ví dụ, Hội nghị giải trí lý) vv Các máy dò khái niệm hoạt động hữu ích ngữ nghĩa lọc cho tìm kiếm video [27, 20, 29] Một khuôn khổ tìm kiếm video liên quan đến hai nỗ lực quan trọng phát khái niệm ẩn lựa chọn trực tuyến máy dò để tìm kiếm hiệu Chung kỹ thuật phát khái niệm nghiên cứu nhiều nghiên cứu năm gần [28, 12] Để xác định tập hợp khái niệm để phát hiện, nỗ lực hợp tác gộp lại để đánh giá tính hữu dụng, khả quan sát, tính khả thi khái niệm [18], dẫn Trang đến quy mô lớn khái niệm luận cho đa phương tiện (LSCOM) bao gồm từ vựng 2000 khái niệm thích 449 khái niệm Với LSCOM, hai phát hiện, Columbia374 [36] VIREO-374 [12], phát hành, bao gồm tính cấp thấp, 374 phát khái niệm (mô hình phân loại), điểm phát TRECVID 2005, Äì2008 liệu 374 khái niệm tập hợp LSCOM với 10 mẫu dương tính thích Ngoài ra, phát thiết lập thường sử dụng MediaMill-101 [28], có-ing 101 phát khái niệm Trên sở phát hiện, dựa khái niệm tìm kiếm video thực thông qua lựa chọn dò thích hợp để giải thích ngữ nghĩa truy vấn Việc lựa chọn thực thông qua văn phù hợp từ truy vấn tên khái niệm [27, 20], dựa điểm số phát máy dò để truy vấn ví dụ hình ảnh / video [4, 27, 29] Chúng tập trung vào việc xem xét lựa chọn dựa văn bản, thực tế khó khăn cho người sử dụng để có ví dụ cho truy vấn họ Chúng phân chia rộng rãi công trình có cho textbased truy vấn lập đồ dò thành hai loại dựa nguồn kiến thức thông qua: 1) Mục đích chung thể học [27, 20, 19, 30], 2) quy mô lớn Web ngữ liệu [20, 8] Trước có giới hạn kiến thức chuyên môn, sau có tốt vùng phủ sóng nội dung, ồn Bản thể học lập đồ dựa trên mục đích chung từ vựng WordNet [6] Thông qua việc sử dụng thông tin từ WordNet, ví dụ tần số từ cấu trúc phân cấp, số kỹ thuật lập luận thể học phát triển để ước lượng Quan hệ ngôn ngữ từ Cho truy vấn văn bản, máy dò chọn trực tuyến dựa họ hàng chúng với lời truy vấn Cụ thể, RES [24] sử dụng nội dung thông tin để đo lường Quan hệ từ thông qua [27, 20] Ngoài ra, Lesk Quan hệ ngữ nghĩa [17] sử dụng [19] để lựa chọn phát Kỹ thuật lập đồ dựa thể học phổ biến khác bao gồm Wu & Palmer (WUP) [34], Jiang & Conrath (JCN) [10] Với kỹ thuật lý luận thể học, tác phẩm gần [30] xây dựng không gian vector, tên thể học làm giàu không gian ngữ nghĩa (OSS), cách xem xét cặp Quan hệ khái niệm Trong chế cửa, hai từ truy vấn phát khái niệm biểu diễn vectơ, đo lường Quan hệ suy từ chế cửa có công đức toàn cầu quán So với thông tin phong phú có sẵn mạng, kiến thức WordNet có nguồn gốc từ nhỏ nhiều lỗi thời corpora (ví dụ, nội dung thông tin ước lượng từ điển Brown) Thiếu sót lớn corpora phạm vi bảo hiểm thấp từ truy vấn phổ biến ước tính khả thiên vị từ / khái niệm tần số, kích thích nghiên cứu khai thác sở liệu lớn có sẵn trái đất Trong [20], Neo cộng mở rộng từ truy vấn sử dụng báo internet để giải thích rõ ngữ nghĩa truy vấn Được mở rộng từ truy vấn sau sử dụng để lựa chọn phát hiện, Trang cách phù hợp với văn trực tiếp dựa kỹ thuật lý luận ngữ nghĩa thể học Một công việc gần [8] cố gắng để ước tính nội dung thông tin từ dựa hai trang web dựa corpora: 1) mẫu trang web mà tải sử dụng thuật ngữ WordNet truy vấn; 2) tất trang web lập mục Google (khái niệm tần số ước tính hiệu cách truy cập trang Google) Với trang web dựa nội dung thông tin, lựa chọn khái niệm thực sử dụng JCN [10] cho tìm kiếm video Các công trình khác cho việc ước tính quan hệ từ sử dụng thông tin từ Web bao gồm khoảng cách Google bình thường hóa (NGD) [5] Flickr khoảng cách [33], mà không thử nghiệm bối cảnh tìm kiếm video Tương tự [8], NGD sử dụng trang số truy cập trả Google để ước tính quan hệ từ Trong điểm cho tất phép đo phổ biến dựa tài liệu văn không phản ánh mối quan hệ xuất đồng thời từ hình ảnh / video, khoảng cách Flickr đề xuất cách đo tương tự hình ảnh dựa tính thị giác Phương pháp này, đầy hứa hẹn tiết lộ xuất đồng thời thị giác, tính toán máy tính đắt tiền để ước tính Quan hệ cặp danh tất từ truy vấn phổ biến mà người sử dụng sử dụng Trong báo này, mô tả phần tiếp theo, áp dụng thông tin ngữ cảnh kết hợp với hình ảnh Flickr để đo Quan hệ từ, mà hiệu NGD từ tìm kiếm web Google phản ánh xuất đồng thời hình ảnh từ (x Phần 5.2) Trong việc lựa chọn phát nghiên cứu công trình khác nhau, vấn đề thay đổi tên miền tìm kiếm video chưa nghiên cứu đầy đủ Trong cách tiếp cận [27, 8, 19, 30], máy dò chọn áp dụng trực tiếp để đáp ứng truy vấn mà không xem xét liệu đặc trưng miền mục tiêu Kể từ lựa chọn thực dựa hai thể học nguồn web, thay đổi tên miền xảy hầu hết trường hợp tìm kiếm video Trong báo này, xem xét vấn đề đầy thách thức thông qua lựa chọn thích ứng phát dựa bối cảnh học ngữ nghĩa từ miền mục tiêu Như thực tế để nhận tầm quan trọng việc đối phó với thay đổi liệu tên miền, có nhiều cách tiếp cận miền truyền học phát triển máy học tập cộng đồng [2, 23] lĩnh vực ứng dụng khác nhau, chẳng hạn phân loại văn [35], xử lý ngôn ngữ tự nhiên [ 9], gần nhất, ngữ nghĩa khái niệm phát [37, 11] Khác với tác phẩm tất thiết kế cho nhiệm vụ phân loại, phương pháp Trang tiếp cận nhằm mục đích thích ứng với giống truy vấn phát hiện, không mô hình phân loại, cho tên miền tìm kiếm video thích nghi III FLICK BỐI CẢNH TƯƠNG TỰ( FCS): Việc thực hành ngày tăng chia sẻ hình ảnh trực tuyến dẫn đến số lượng lớn hình ảnh người tiêu dùng truy cập trực tuyến Ngoài nội dung hình ảnh phong phú, khía cạnh hấp dẫn hoạt động chia sẻ hình ảnh thông tin ngữ cảnh tạo người sử dụng để mô tả ảnh Như thể hình (a), thông tin ngữ cảnh phong phú bao gồm tiêu đề, thẻ, mô tả bình luận, mà sử dụng cho ứng dụng khác nhau, chẳng hạn biểu tượng hệ hình ảnh [16], từ khóa định hướng [32] ảnh, dựa địa điểm tổ chức [1] Trong phần này, khám phá thông tin bối cảnh để đo lường tương tự từ, nhằm phản ánh họ Hình 2: (a) thông tin ngữ cảnh phong phú kết hợp với hình ảnh Flickr (b) Tổng số hình ảnh quay trở lại sử dụng từ khóa tìm kiếm dựa bối cảnh hình ảnh Flickr thống kê xuất đồng thời liệu hình ảnh corpora văn sử dụng [27, 20, 19, 8, 5] Với hai từ, tính toán họ hàng chúng dựa số lượng hình ảnh Flickr liên kết với chúng Với số lượng kết Trang trả Flickr, áp dụng NGD bắt nguồn từ lý thuyết phức tạp Kolmogorov để ước tính từ khoảng cách [5]: h (x) số hình ảnh liên quan với từ x bối cảnh họ, h (x, y) số hình ảnh liên quan đến hai từ x y; N tổng số hình ảnh Flickr, tạm ước tính 3,5 tỷ USD vào thời điểm làm thí nghiệm Các NGD sau chuyển lên Flickr bối cảnh tương tự (FCS) sử dụng hạt nhân Gaussian, định nghĩa như: đâu tham số ρ theo kinh nghiệm máy đôi số trung bình - khôn ngoan NGD ngẫu nhiên vũng tập hợp từ Đường tương tự đặt ρ trưng bày để có hiệu cho nhiệm vụ phân loại sở nhân [ 38 ] Thí dụ tính FCS trình bày Hình ( b ) Ưu điểm việc sử dụng thông tin ngữ cảnh đầy đủ thay thẻ bảo hiểm tốt từ Hình cho thấy tần số 374 LSCOM khái niệm nhiều nguồn khác bao gồm Google tìm kiếm web, Flickr bối cảnh hình ảnh / thẻ, LSCOM dẫn thích TRECVID 2005 phát triển (43.873 ảnh) Rõ ràng Google tìm kiếm web có bảo hiểm tốt nhất: khái niệm xuất 2120 trang web Ngoài ra, nhìn thấy rõ ràng phạm vi khái niệm bối cảnh Flickr tốt nhiều so với thẻ Flickr Chỉ có khái niệm có tần số không bối cảnh, trong thẻ, 53 khái niệm không tìm thấy Mặc dù vùng phủ sóng bối cảnh Flickr không tốt tìm kiếm web Google, hiển thị thí nghiệm, có công đức phản ánh hình ảnh xuất đồng thời từ Nó đáng giá để nguồn dựa web có thực nhiễu Ví dụ, độ xác thẻ Flickr tìm thấy vào khoảng 50% [15] Vấn đề nhiễu tồn nhiều trang web lập mục Google Một trang web chứa nhiều đoạn văn văn thảo luận chủ đề khác biệt, kết ước tính sai lệch từ xuất đồng thời Tuy nhiên, ghi nhận [5], tiếng ồn phần làm tăng kích thước sở liệu khổng lồ Điều giải thích trực giác thực tế hai từ không liên quan xảy nhiễu, có lẽ không thường xuyên Nói cách khác, sở liệu tăng kích thước, số lượng xuất đồng thời hai Trang 10 4.1 Dò lọc ngoại tuyến: Trước tiên xây dựng chuyển bối cảnh ngữ nghĩa Offline cho sàng lọc khái niệm máy dò điểm xem xét thực tế phân bố liệu thay đổi X X, để xử lý vấn đề này, chuyển bối cảnh ngữ nghĩa nên điều tra để suy khái niệm tốt mối quan hệ W Để đạt điều này, xác định hàm mạo hiểm: Trong đó: F khái niệm máy dò điểm lọc wtgt mối quan hệ phù hợp Cụ thể, hàm rủi ro có chứa hai thành phần: hạn chế thống nội miền thay đổi liên miền tắc, định nghĩa là: f (ci) số điểm dự đoán cho khái niệm c mẫu thử nghiệm phạm vi mục tiêu; w w đại diện cho mối quan hệ khái niệm c c huấn luyện kiểm tra liệu mục tiêu tương ứng; λ nắm bắt cân hai thuật ngữ Hàm rủi ro giải thích trực quan sau: Thứ nhất, hạn chế thống nội miền đảm bảo điểm phát khái niệm tương tự hai khái niệm liên quan chặt chẽ với nhau, ví dụ wij lớn Nói cách khác, giảm thiểu J làm cho điểm phát phù hợp với khái niệm mối quan hệ Thứ hai, thay đổi liên miền tắc có nghĩa khái niệm phù hợp mối quan hệ Wtgt không nên chệch nhiều từ ban đầu Wtrn Giả thuyết tương tự áp dụng phân loại phương pháp tiếp cận học tập chuyển giao [35] Do làm giảm giá trị J cho phép sàng lọc đồng thời số điểm phát khái niệm mối quan hệ Để giảm thiểu J, viết lại thành dạng ma trận: Trang 13 Phát sinh khác biệt phần J Wtgt không: Để lấy tối ưu điểm phát F, áp dụng độ chênh lệch ngẫu nhiên để phục hồi thống nội miền Với khái niệm mối quan hệ W phạm vi mục tiêu, F cập nhật : Trong khác biệt phần J Ftgt với Tham số η thường gọi tốc độ học tập Lưu ý phương trình 11 khái niệm mối quan hệ W tối ưu hóa dựa số điểm hiển ban đầu F Trên thực tế, phương trình 11 12 áp dụng lặp lặp lại để thích ứng với ma trận mối quan hệ khái niệm sau lọc điểm phát cho phù hợp (x Thuật toán 1) 4.2 Thích ứng trực tuyến truy vấn dò tương đồng Bây xem xét vấn đề trực tuyến cập nhật truy vấn dò wq tương tự dựa mục tiêu miền liệu đặc trưng Nhắc lại w = {s(q, c )} =1 ··· ∈ R m×1 s (q, c) đại diện cho số điểm phù hợp khái niệm c để truy vấn q, ước tính từ nguồn kiến thức bên Flickr bối cảnh Thúc đẩy kỹ thuật theo quy tắc đa dạng trực tuyến không gian đặc trưng [7], đề xuất ngữ nghĩa thuật toán chuyển bối cảnh trực tuyến sau Cụ thể, nút thêm vào không gian khái niệm đại diện cho q Chúng xác định điều khoản sau đầu tiên: w truy vấn, phát vector tương tự thích nghi f (q) ∈ R1 ×n số điểm liên quan ban đầu để q, tính phương trình Lưu ý lọc điểm phát điều chỉnh khái niệm mối quan hệ ma trận Wtgt sử dụng Trang 14 đầu vào việc chuyển bối cảnh trực tuyến ngữ nghĩa Các ma trận đối xứng Bây ghi lại hàm rủi ro phương trình 10 vào mẫu trực tuyến sau đây: Trong Φ Ω thể phiên trực tuyến nội miền hạn chế quán thay đổi liên miền tắc tương ứng Rõ ràng, cách xử lý truy vấn q nút không gian khái niệm, giảm thiểu J w với tạo điều kiện cho thích nghi mối quan hệ phát truy vấn Ngoài ra, truy vấn mối quan hệ phát thích nghi áp dụng để lọc truy vấn liên quan điểm f (q).Các trình kép tương tự thích ứng khái niệm mối quan hệ sàng lọc điểm phát khái niệm chuyển đổi offline Để rút gọn phương trình 14, mở rộng Φ sau: Tương tự vậy, mở rộng phiên trực tuyến thay đổi liên miền tắc : Trang 15 Với phương trình 15 16, dễ dàng lấy phần hàm rủi ro J* wq: Thuật toán 1: Ngữ nghĩa chuyển bối cảnh: Đầuvào: phát ban đầu điểm Ftgt; khái niệm ban đầu mối quan hệ ma trận W Khởi tạo: Vòng lặp: t = 0, · · ·, T1 Đầu ra: Lọc số điểm phát ; Ma trận khái niệm mối quan hệ thích nghi Wtgt Chuyển trực tuyến: Đầu vào: phát tinh lọc điểm điều chỉnh khái niệm mối quan hệ ma trận Wtgt; truy vấn ban đầu dò tương tự wq ban đầu truy vấn q khởi tạo: Vòng lặp: t = 0, · · ·, T2 Đầu ra: lọc số điểm truy vấn phù hợp Quy khác biệt phần trên, truy vấn tối ưu phát tương tự tính như: Trang 16 Với điều chỉnh truy vấn dò tương tự cập nhật phù hợp: , số điểm phù hợp truy vấn Trong vector hàng Tương tự * trình chuyển tuyến, J giảm thiểu lặp lặp lại thông qua cập nhật wq f(q) sau: Các phương trình đạt sàng lọc trực tuyến đồng thời truy vấn phát tương tự truy vấn số điểm liên quan Lưu ý việc thực chúng tôi, để giữ cho w thưa thớt, làm tròn thành phần tuyệt đối nhỏ không lần lặp với giá trị Trang 17 V 5.1 THỬ NGHIỆM Bộ liệu đánh giá Chúng tiến hành thí nghiệm tìm kiếm video cách sử dụng TRECVID 20052008 tập hợp liệu (abbr TV05/06/07/08), sử dụng việc đánh giá chuẩn hàng năm NIST tổ chức Tổng cộng, có 440 liệu video 120 truy vấn đánh giá thức Các liệu kèm với tài liệu tham khảo tiêu chuẩn ranh giới bắn, tạo thành đơn vị để đánh giá Mô tả chi tiết liệu năm liệt kê Bảng Như thể bảng, TV05 TV06 phát sóng tin tức video từ Hoa Kỳ, Ả Rập, nguồn Trung Quốc, TV07 TV08 chủ yếu tài liệu video từ Viện Hà Lan cho âm tầm nhìn Bảng 1: Mô tả TV05-08 liệu Tổng số ảnh video liệu hiển thị dấu ngoặc đơn Các 160h (100h) liệu từ TV05 (07) sử dụng liệu phát triển cho TV06 (08) Bảng cho thấy ví dụ số truy vấn văn bản, thường ngắn viết tắt với vài từ Trong suốt thí nghiệm, xem xét danh từ động danh từ truy vấn để lựa chọn phát hiện, giả định danh từ tên địa điểm, vật hay người (ví dụ, máy tính), động danh từ mô tả hành động / kiện (ví dụ, bộ) Trong việc đánh giá tiêu chuẩn, hầu hết truy vấn liên kết vài truy vấn hình ảnh / video ví dụ, trong thí nghiệm, sử dụng truy vấn văn So với truy vấn với ví dụ hình ảnh / video, điều đại diện cho kịch tổng quát thực tế tìm kiếm video Đối với máy dò khái niệm ngữ nghĩa, sử dụng VIREO374 [12] cho TV05-07 VIREO-374 bao gồm máy dò cho 374 LSCOM khái niệm ngữ nghĩa điểm phát họ TV05-07 kiểm tra Các máy dò Trang 18 VIREO-374 huấn luyện sử dụng thiết lập phát triển TV05 Mỗi phát có liên quan đến ba phân loại SVM huấn luyện sử dụng tính hình ảnh khác (thời điểm màu sắc, kết cấu wavelet túi từ hình ảnh) chiết xuất từ khung hình video Các đầu ba phân loại kết hợp số điểm phát cuối sử dụng kết hợp trung bình Cho TV08, sử dụng gần phát hành CUVIREO374 [14] Dựa điểm phát hiện, trực tiếp làm việc thử nghiệm năm thiết lập để đánh giá hiệu miền thích ứng phương pháp tìm kiếm video Đối với truy vấn, ảnh đoạn video truy xuất xếp hạng theo điểm số để máy dò khái niệm lựa chọn Việc thực tìm kiếm đánh giá sử dụng xác trung bình, định nghĩa R Rj tổng số mặt tích cực thực tập kiểm tra toàn top j ảnh tương ứng; Ij = j ảnh có liên quan ngược lại Để tổng hiệu suất truy vấn nhiều hơn, có nghĩa độ xác trung bình (MAP) sử dụng Trong thí nghiệm, trừ có quy định khác, thiết lập k = 1000 sau tiêu chuẩn TRECVID Trong phần tiếp theo, so sánh FCS với loạt phép đo tương tự từ Sau đánh giá hiệu thuật toán chuyển bối cảnh ngữ nghĩa cho tên miền tìm kiếm video thích nghi 5.2 Truy vấn dò Tương tự Đo lường Để kiểm tra chất lượng việc sử dụng bối cảnh Flickr để ước lượng truy vấn tương tự phát hiện, so sánh với FCS năm biện pháp khác, bao gồm khoảng cách Google bình thường (NGD) [5] sử dụng tìm kiếm web Yahoo nguồn kiến thức, đo lường WordNet dựa bao gồm RES [24], JCN [10], WUP [34], Lesk [17] RES JCN sử dụng nội dung thông tin ước tính dựa Corpus Brown lý mối quan hệ truy vấn, phát hiện, Lesk WUP sử dụng lời giải chiều dài / chiều sâu đường hệ thống phân cấp WordNet tương ứng Đối với từ truy vấn, lựa chọn phát có liên quan Kết tìm kiếm trả máy dò sau tuyến tính hợp (phương trình 5) Tùy thuộc vào biện pháp sử dụng, trọng lượng máy dò thiết lập giống với truy vấn tương ứng Hình cho thấy kết thực nghiệm chi tiết MAP thử nghiệm khác Chúng ta thấy hiệu suất đo lường dựa web kiến thức, đặc biệt FCS, rõ ràng tốt so với dựa WordNet Sự cải thiện đặc biệt rõ ràng cho TV05 TV07 nơi có nhiều từ truy vấn mà phát với xác tên tìm thấy Các trang web cung cấp thông tin cập nhật Trang 19 bảo hiểm tốt từ, mà thực hữu ích cho trường hợp Ví dụ, cho truy vấn hạn Condoleeza Rice1(Một tên công cụ phát thực thể áp dụng để từ từ tên không coi thuật ngữ truy vấn riêng biệt) mà không xuất WordNet, phát Colin Powell Donald Rumsfeld đề xuất NGD FCS tương ứng, kể từ hai người số họ thường xuyên xảy với Condoleeza Rice Mặt khác, FCSalso liên tục nhanh so với NGD với biên độ lớn (phạm vi cải thiện hiệu suất từ 7% lên 41%) Điều thực khẳng định lợi việc sử dụng bối cảnh Flickr để ước lượng truy vấn máy dò tương tự thảo luận phần 3, phản ánh từ xuất đồng thời nội dung hình ảnh (hình ảnh) ngữ liệu văn Bảng 2: lựa chọn dò phép đo tương tự truy vấn máy dò khác Các máy dò lựa chọn dựa từ truy vấn in đậm Bảng đưa vài ví dụ truy vấn để so sánh thêm phép đo khác Do hạn chế không gian, liệt kê phát phù hợp cho từ chọn từ truy vấn Trong truy vấn ID-188, cho truy vấn từ lửa Phát binh lính lựa chọn NGD khói chọn FCS Trong việc lựa chọn người lính (ví dụ, cảnh chiến tranh) không hút thuốc có khả hữu ích cho việc tìm kiếm video lửa, mối quan hệ ngữ nghĩa không bị bắt WordNet Quan sát tương tự dùng cho truy vấn ID-171/196/205 Thú vị hơn, so với NGD, thấy FCS có khả lựa chọn dò phù hợp Ví dụ, truy vấn ID-205, xe lựa chọn NGD để trả lời truy vấn đào tạo hạn có nhiều trang web có chứa nội dung liên quan đến loại xe Tuy nhiên, rõ ràng xe có khả hữu ích cho lấy xe lửa họ xảy liệu hình ảnh / video Trong cho FCS, máy dò phù hợp hơn, đường sắt, chọn Những quan sát lần khẳng định lợi việc sử dụng FCS để lựa chọn phát tìm kiếm video Tuy nhiên, lưu ý FCS lãm hứa hẹn kết nhiều trường hợp, việc lựa chọn thực dựa kiến thức từ trang web mà không xem xét đặc điểm liệu lĩnh vực liệu mục tiêu Trong phần Trang 20 tiếp theo, thử nghiệm rộng rãi để xem cách thuật toán chuyển bối cảnh ngữ nghĩa hoạt động để đối phó với thay đổi tên miền 5.3 Ảnh hưởng ngữ nghĩa ngữ cảnh Chuyển hiệu suất chuyển bối cảnh ngữ nghĩa (SCT) liệu khác thể Bảng Bảng 3: Hiệu tìm kiếm TV05-08 MAP-k có nghĩa MAP top k xếp hạng ảnh Hình 5: Hiệu suất MAP TV05 cách thay đổi số lần lặp để chuyển bối cảnh ngữ nghĩa trực tuyến Để phân tích hiệu suất tốt hơn, liệt kê MAP đầu k = 10, 30, 100 1000 xếp hạng ảnh Rõ ràng, SCT cho thấy tăng hiệu suất đáng kể cho hầu hết thiết lập thử nghiệm Khi k = 1000, ngoại trừ TV07 hiệu suất nhau, cải thiện ba thử nghiệm khác đặt khoảng từ 8% đến 16% Đây hoàn toàn bất ngờ số tất kiểm tra, TV07 có số lượng nhỏ mặt tích cực thực (196 cho truy vấn trung bình) Từ phân tích phân bố dương tính thực danh sách xếp hạng, cho TV07, ảnh có liên quan quan sát top 100, thử nghiệm khác, ảnh có liên quan có xu hướng lan rộng khắp danh sách kết Khi xem xét k ảnh lấy ra, cải thiện MAP trở nên rõ ràng Ví dụ, TV07, cải thiện danh sách xếp hạng top 10 cao 23% Điều quan trọng thực tế cho hầu hết ứng dụng tìm kiếm, top 10 số hợp lý kết mà người dùng duyệt Trang 21 Nghiên cứu ảnh hưởng chuyển Offline tiến hành thí nghiệm khác TV08, áp dụng phương trình 11 12 để cập nhật số điểm phát hiện, bỏ qua trình chuyển giao trực tuyến Việc thực MAP1000 0.046, mà rõ ràng thấp so với trực tuyến chuyển giao đồng áp dụng (0.050) Như đề cập phần 4, dễ hiểu tìm kiếm video truy vấn tương tự phát quan trọng Ngoài ra, nâng cao độ xác phát khái niệm không đảm bảo hiệu suất phản ứng tổng hợp tốt Đạt hiệu suất sử dụng cải thiện dò tìm kiếm video tương tự báo cáo nghiên cứu trước [31] Để xác minh xem việc cải thiện hiệu hội, tiến hành thử nghiệm quan trọng dựa AP cho truy vấn (k = 1000) Chúng áp dụng thử nghiệm ngẫu nhiên đề xuất TRECVID3, nơi số lượng mục tiêu erations thiết lập 10.000 Ở mức 0,05 có ý nghĩa, FCS + SCT tốt đáng kể so với FCS, FCS tốt đáng kể so với phép đo tương tự từ khác 5.3.1 Tham số độ nhạy: Có bốn thông số thuật toán chuyển đổ ngữ nghĩa bối cảnh khuôn đồng nhất, bao gồm λ, η, số lần ngoại tuyến trực tuyến tương ứng T1 T2 Trong suốt thí nghiệm, λ, η T1 thống thiết lập tương ứng 0.1, 0.05 20 , rút từ phát [13] Đối với số lần trao đổi trực tuyến lặp lặp lại (T2) , thực nghiệm xác định giá trị thích hợp Chúng đánh giá độ nhạy hiệu suất tìm kiếm T2 TV05 Như thể hình 5,hiệu tăng đáng kể từ đầu sau ổn định vài lần lặp lại Ngoài ra,chúng ta thấy với độ xác tốt tốt gần đạt T2 khoảng T2 tương tự áp dụng tất thí nghiệm tăng hiệu suất phù hợp quan sát so với kiểm tra TV06-08 (theo Bảng 3), xác nhận ổn định hiệu suất thuật toán đề xuất thông số cài đặt 5.3.2 Tốc độ hiệu Tốc độ yêu cầu quan trọng cho tìm kiếm video trực tuyến Các thuật toán chuyển bối ngữ nghĩa bối cảnh trực tuyến hiệu Sự phức tạp thuật toán theo tiêu chuẩn ISO (triệu), m số lượng dò có sẵn n số ảnh thử nghiệm Cụ thể hơn, tổng số thời gian chạy 24 truy vấn Trang 22 TV06 (79.484 ảnh video) 30,2 giây PC thông thường (Intel Core Duo 2.2GHz CPU RAM 2GB) Nói cách khác, thực chuyển giao trực tuyến với truy vấn 1.26 giây Nó nhanh thực máy mạnh mẽ với khả tính toán song song Rõ ràng, điều đáp ứng nhu cầu tìm kiếm trực tuyến 5.4 Thực dựa loại truy vấn: Tiếp tục nghiên cứu hiệu biện pháp tương tự thuật toán chuyển bối cảnh ngữ nghĩa Bây h thảo luận thực tìm kiếm dựa loại truy vấn Chúng ta có 120 truy vấn thành bốn loại: kiện, người + điều(TT), địa điểm tên thực thể (NE) Các nhóm dựa phân loại truy vấn đề xuất TRECVID [22] Bởi hầu hết truy vấn liên quan đến TT, loại trừ truy vấn từ PT nằm ba thể loại khác Biểu đồ cho thấy trình diễn MAP-1000 Các biện pháp dựa web (NGD FCS) đặc biệt tốt cho truy vấn theo tên thực thể Đây thực tế hầu hết tên đơn vị không định nghĩa WordNet Nhìn chung, cách thực tốt tất lớp truy vấn FCS + SCT Các quan sát cho thấy ưu điểm ổn định phương pháp tiếp cận loại truy vấn khác Mặt khác, FCS việc thực NGD Lesk, Nó tính toán dựa trang web từ vựng WordNet tương ứng Để liên tục xác minh tính quán cải thiện hiệu suất cho loại truy vấn khác nhau, tiến hành kiểm tra ngẫu nhiên mức quan trọng 0.05 Kết tóm tắt bảng Bảng 4: Ý nghĩa thử nghiệm dựa loại truy vấn x>>y có nghĩa x tốt đáng kể so với y Ngoại trừ NE, FCS + SCT tốt đáng kể so với FCS FCS hiệu NGD Lesk Với NE,nó không cải thiện quan sát từ SCT máy tìm kiếm lựa chọn NGD / FCS thích hợp Trang 23 5.5 So sánh phương pháp theo giai đoạn: Trong phần này, so sánh kết cho số nghiên cứu gần dựa khái niệm tìm kiếm video [8, 20, 27, 31] Dựa nội dung thông tin trang web sử dụng [8, 20] để lựa chọn phát hiện, thể đo lường tương tự dựa WordNet thông qua [27] Trong [31], khuôn khổ hợp đa cấp phát triển xem xét ngữ nghĩa, nhận biết, độ tin cậy đa dạng để phát lựa chọn Lưu ý số lại kết báo cáo tác phẩm sử dụng dò tìm khác Mục đích việc so sánh để hiển thị toàn khuôn khổ đề xuất báo thực so sánh phương pháp theo giai đoạn Bảng liệt kê hoạt động phương pháp tiếp cận kiểm tra TV05-08 Miền tìm kiếm khung hình video thích hợp và(FCS+SCT) thực tốt cho kiểm tra tất bốn năm Bảng 5: So sánh hiệu suất thử nghiệm Tv05-08 Biểu đồ 7: So sánh MAP với top 50 (trong tổng 82) Bài kiểm tra thức nhiệm vụ tìm kiếm video tự động TRECVID 200 Lưu ý số yếu tố hữu ích đa dạng máy dò lựa chọn [31] không xem xét khuôn khổ áp dụng để cải thiện Hình tiếp tục so sánh kết với kiểm tra thức TV08 Trang 24 Trong số tất 82 nhiệm vụ nhỏ, đề xuất sử dụng FCS+ SCT để truy vấn văn đứng hàng thứ năm, tất bốn phương pháp đứng chạy thông qua hai truy vấn văn ví dụ hình ảnh / video mẫu, hệ thống thực tốt [29] có ba cách thực : văn phù hợp , tìm kiếm dựa khái niệm, hình ảnh / video mẫu phù hợp Trang 25 VI KẾT LUẬN Trên chúng em tìm hiểu số phương pháp chuyển đổi ngữ nghĩa bối cảnh nguồn không đồng cho miền tìm kiếm video tương ứng Cho truy vấn văn bản, sử dụng bối cảnh Flickr để lựa chọn phát khái niệm ban đầu, sau chuyển ngữ nghĩa bối cảnh học từ miền liệu mục tiêu để cải thiện độ xác phát khái niệm lọc phát tương tự Các thí nghiệm xác nhận rộng rãi lợi ích FCS phát hình ảnh xuất đồng thời từ tính hiệu thuật toán chuyển bối cảnh ngữ nghĩa để tìm kiếm miền thích ứng Cải tiến đáng kể phù hợp báo cáo thi TV05-08 chuẩn tìm kiếm video Thực chất hệ thống tìm kiếm video áp dụng cho liệu từ tên miền Thuật toán biết bối cảnh ngữ nghĩa từ miền mục tiêu dựa kết đầu máy dò tìm ngữ nghĩa trước thực hiện, mà không đòi hỏi hướng dẫn sử dụng liệu thử nghiệm Sự tiếp nhận không giám sát thay đổi miền coi công đoạn quan Trang 26 VII TÀI LIỆU THAM KHẢO [1] S Ahern, M Naaman, R Nair, and J Yang World explorer: Visualizing aggregate data from unstructured text in geo-referenced collections In JCDL, 2007 [2] A Argyriou, T Evgeniou, and M Pontil Multi-task feature learning In NIPS, 2006 [3] J A Aslam, V Pavlu, and E Yilmaz Statistical method for system evaluation using incomplete judgments In ACM SIGIR, 2006 [4] M Campbell and et al IBM research trecvid-2006 video retrieval system In TRECVID Workshop, 2006 [5] R L Cilibrasi and P M Vitanyi The google similarity distance IEEE Trans on Knowledge and Data Engineering, 19:370–383, 2007 [6] C Fellbaum and Ed WordNet: an electronic lexical database The MIT Press, 1998 [7] A B Goldberg, M Li, and X Zhu Online manifold regularization: A new learning setting and empirical study In ECML PKDD, 2008 [8] A Haubold and A Natsev Web-based information content and its application to concept-based video retrieval In CIVR, 2008 [9] J Jiang and C Zhai Instance weighting for domain adaptation in NLP In ACL, 2007 [10] J J Jiang Semantic similarity based on corpus statistics and lexical taxonomy In ROCLING, 1997 Trang 27 [...]... thuật toán chuyển bối cảnh ngữ nghĩa hoạt động để đối phó với thay đổi tên miền 5.3 Ảnh hưởng của ngữ nghĩa ngữ cảnh Chuyển hiệu suất của chuyển bối cảnh ngữ nghĩa (SCT) trên bộ dữ liệu khác nhau được thể hiện trong Bảng 3 Bảng 3: Hiệu quả tìm kiếm trên TV05-08 MAP-k có nghĩa là MAP top k xếp hạng bức ảnh Hình 5: Hiệu suất của MAP trên TV05 bằng cách thay đổi số lần lặp để chuyển bối cảnh ngữ nghĩa trực... tính hiệu quả của thuật toán chuyển bối cảnh ngữ nghĩa của chúng tôi để tìm kiếm miền thích ứng Cải tiến đáng kể và phù hợp được báo cáo trong cuộc thi TV05-08 chuẩn tìm kiếm video Thực chất là một hệ thống tìm kiếm video có thể được áp dụng cho dữ liệu từ tên miền bất kỳ Thuật toán biết bối cảnh ngữ nghĩa từ miền mục tiêu dựa trên kết quả đầu ra của các máy dò tìm ngữ nghĩa trước khi được thực hiện,... ứng hàng thứ năm, trong khi tất cả bốn phương pháp ứng trên đều chạy thông qua cả hai truy vấn văn bản và các ví dụ hình ảnh / video mẫu, các hệ thống thực hiện tốt nhất [29] có ba cách thực hiện : văn bản phù hợp , tìm kiếm dựa trên khái niệm, và hình ảnh / video mẫu phù hợp Trang 25 VI KẾT LUẬN Trên đây chúng em đã tìm hiểu một số phương pháp chuyển đổi ngữ nghĩa bối cảnh trên nguồn không đồng nhất. .. cho nó như miền thích ứng phổ biến ngữ nghĩa Chuyển ngữ nghĩa bối cảnh trực tuyến Vector w cho một truy vấn q được ước lượng từ nguồn kiến thức bên ngoài, rõ ràng là không thể mô tả chính xác các truy vấn dò tương tự trong một tên miền mới Chuyển ngữ nghĩa bối cảnh trực tuyến nhằm mục đích đồng thời thích nghi và cập nhật w f (q) dựa trên mục tiêu đặc điểm dữ liệu miền, được định nghĩa như trong đó w... tương tự từ hiện tại Sau đó chúng tôi đánh giá hiệu quả của thuật toán chuyển bối cảnh ngữ nghĩa của chúng tôi cho tên miền tìm kiếm video thích nghi 5.2 Truy vấn dò Tương tự Đo lường Để kiểm tra chất lượng của việc sử dụng bối cảnh Flickr để ước lượng truy vấn tương tự phát hiện, chúng ta so sánh với FCS năm các biện pháp khác, bao gồm cả khoảng cách Google bình thường (NGD) [5] sử dụng tìm kiếm trên. .. bày thuật toán bước một hai cuốn tiểu thuyết ngữ nghĩa chuyển ngữ cảnh Cụ thể, thuật toán nhằm mục đích chuyển bối cảnh ngữ nghĩa suy ra từ tên miền mục tiêu để thích ứng với f (ci) và s (q, ci) Sự thích nghi trước đây là offline được tiến hành bởi các khi Xtgt đến, trong khi sau này được tính toán trên bay khi truy vấn được phát hành Chuyển ngữ nghĩa bối cảnh offline.Do ban đầu phát hiện số điểm Ftgt... một số phương pháp chuyển đổi ngữ nghĩa bối cảnh trên nguồn không đồng nhất cho miền tìm kiếm video tương ứng Cho một truy vấn văn bản, sử dụng bối cảnh Flickr để lựa chọn phát hiện khái niệm ban đầu, và sau đó chuyển ngữ nghĩa bối cảnh học từ miền dữ liệu mục tiêu để cải thiện độ chính xác phát hiện khái niệm và lọc phát hiện tương tự Các thí nghiệm xác nhận rộng rãi những lợi ích của FCS trong phát... 1.26 giây Nó có thể được nhanh hơn nếu thực hiện trên một máy mạnh mẽ hơn với khả năng tính toán song song Rõ ràng, điều này đáp ứng nhu cầu tìm kiếm trực tuyến 5.4 Thực hiện dựa trên các loại truy vấn: Tiếp tục nghiên cứu hiệu quả của từng biện pháp tương tự và các thuật toán chuyển bối cảnh ngữ nghĩa Bây h chúng ta thảo luận về thực hiện tìm kiếm dựa trên các loại truy vấn Chúng ta có 120 truy vấn... chứa các cập nhật tương tự truy vấn, phát hiện và lọc điểm truy vấn liên quan tương ứng này Trong phần tiếp theo, chúng tôi giới thiệu ngắn gọn của chúng tôi xây dựng cho chuyển offline, trên cơ sở đó chúng tôi lấy được thuật toán chuyển trực tuyến, mà là trọng tâm chính của bài viết này Trang 12 4.1 Dò lọc ngoại tuyến: Trước tiên chúng ta xây dựng các chuyển bối cảnh ngữ nghĩa Offline cho các sàng lọc... hình ảnh / video ví dụ, trong khi trong các thí nghiệm, chúng tôi chỉ sử dụng các truy vấn văn bản So với truy vấn với các ví dụ hình ảnh / video, điều này đại diện cho một kịch bản tổng quát hơn và thực tế tìm kiếm video Đối với các máy dò khái niệm ngữ nghĩa, chúng tôi sử dụng VIREO374 [12] cho TV05-07 VIREO-374 bao gồm máy dò cho 374 LSCOM khái niệm ngữ nghĩa và điểm phát hiện của họ trên TV05-07

Ngày đăng: 30/12/2015, 20:39

Từ khóa liên quan

Mục lục

  • LỜI NÓI ĐẦU

  • I. GIỚI THIỆU

  • II. CÔNG VIỆC LIÊN QUAN

  • III. FLICK BỐI CẢNH TƯƠNG TỰ( FCS):

  • IV. NGỮ NGHĨA CHUYỂN BỐI CẢNH

    • 4.1 Dò lọc ngoại tuyến:

    • 4.2 Thích ứng trực tuyến của truy vấn dò tương đồng

    • V. THỬ NGHIỆM

      • 5.1 Bộ dữ liệu và đánh giá

      • 5.2 Truy vấn dò Tương tự Đo lường

      • 5.3 Ảnh hưởng của ngữ nghĩa ngữ cảnh Chuyển.

        • 5.3.1 Tham số độ nhạy:

        • 5.3.2 Tốc độ hiệu quả

        • 5.4 Thực hiện dựa trên các loại truy vấn:

        • 5.5 So sánh các phương pháp theo từng giai đoạn:

        • VI. KẾT LUẬN

        • VII. TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan