Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)

24 372 0
Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)Nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (tt)

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - HOÀNG ANH MINH NGHIÊN CỨU PHƯƠNG PHÁP HỌC MÁY TRONG XÂY DỰNG HỆ GỢI Ý ÂM NHẠC CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN DUY PHƯƠNG HÀ NỘI - 2016 Luận văn hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS Nguyễn Duy Phương Phản biện 1: PGS.TS Phạm Văn Cường…………………………… Phản biện 2: PGS.TS Đoàn Văn Ban………………………………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thông Vào lúc: ngày tháng năm … Có thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thông MỞ ĐẦU Lý chọn đề tài Trong đời sống nay, nhu cầu giải trí người Việt Nam ngày cao Sự bùng nổ Internet kéo theo phát triển ứng dụng giải trí trực tuyến Chỉ tính riêng Việt Nam, website với ứng dụng game, xem phim, nghe nhạc trực tuyến xuất ngày nhiều vài năm trở lại Trong trình sử dụng ứng dụng giải trí trực tuyến nghe nhạc, có lúc người dùng muốn nghe nhạc họ chưa nghe lại tìm nhạc phù hợp Nắm bắt nhu cầu website nghe nhạc trực tuyến đưa công cụ nhằm gợi ý cho người nghe nhạc mà họ cho người dùng thích dựa phương pháp học máy Các diễn đàn trao đổi phương pháp học máy để gợi ý nhạc tổ chức hàng năm đề nâng cao chất lượng cho hệ thống gợi ý Với mục đích đưa cho người sử dụng gợi ý gần nhất, tiện lợi cho người dùng, qua nâng cao chất lượng phục vụ website nghe nhạc trực tuyến Đề tài “Nghiên cứu phương pháp học máy ứng dụng xây dựng hệ gợi ý âm nhạc”, nhằm cung cấp nhìn phương pháp học máy gợi ý âm nhạc, phân tích, so sánh phương pháp lựa chọn phương pháp để xây dựng hệ thống gợi ý cho website nghe nhạc trực tuyến Tổng quan vấn đề nghiên cứu Hiện nay, thị trường Việt Nam nói riêng có website phổ biến với người dùng internet mp3.zing.vn nhaccuatui.com Hai website có số lượng người dùng đông đảo với số lượng đồ sộ nhạc có quyền Người sử dụng dễ dàng tìm hát cần website Tuy website có ứng dụng gợi ý nhạc cho người dùng user sử dụng tính nhạc gợi ý chưa thật hợp lý Bài toán đặt phương pháp sử dụng website chưa hiệu sử dụng phương pháp đạt hiệu tốt Chúng tìm cách phần giải điều phạm vi luận văn Mục đích nghiên cứu Mục đích chung đề tài học viên thực hành nghiên cứu, kết thúc khóa đào tạo sau đại học, hoàn thành Luận văn Thạc sĩ CNTT Mục đích thực tiễn đề tài đưa hệ thống gơi ý phù hợp với nhu cầu người dùng nâng cao chất lượng website nghe nhạc trực tuyến Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu bao gồm kỹ thuật, phương pháp học máy sử dụng để gợi ý liệu Các phương pháp học máy tìm hiểu phạm vi liệu nhạc, xử lý nhạc Phương pháp nghiên cứu Nghiên cứu lý thuyết, tìm hiểu phương pháp học máy, tìm hiểu siêu liệu để xử lý nhạc, nhu cầu người dùng Cấu trúc luận văn Nội dung luận văn trình bày ba phần sau: Phần mở đầu Phần nội dung: bao gồm ba chương Chương 1: Tổng quan học máy hệ gợi ý Chương 2: Phương pháp gợi ý kết hợp lọc cộng tác lọc nội dung Chương 3: Xây dựng hệ thống gợi ý cho website nghe nhạc trực tuyến Phần kết luận CHƯƠNG TỔNG QUAN VỀ HỌC MÁY TRONG HỆ GỢI Ý 1.1 Hệ gợi ý Khi ta truy cập vào website bán hàng trực tuyến để duyệt mặt hàng yêu thích Tại trang chứa thông tin mặt hàng có mục có tiêu đề “Khách hàng mua sản phẩm mua sản phẩm sau” Những mặt hàng danh sách sản phẩm có khả gây ý cho khách hàng liệt kê dựa thông tin sản phẩm xem xét Để có danh sách gợi ý dành riêng cho cá nhân ta cần thu thập thông tin người dùng Những thông tin thu thập cách yêu cầu người dùng đánh giá sản phẩm mà họ quan tâm cách giám sát ngầm hành vi họ Học máy lọc cộng tác Phương pháp gợi ý phổ biến lọc cộng tác Hệ thống tận dụng lợi công tác ngầm định người dùng Cách tiếp cận không đòi hỏi hiểu biết thực tế cụ thể mặt hàng gợi ý Điểm mạnh rõ ràng cách tiếp cận chúng không cần sử dụng đến liệu phức tạp trì chúng hệ thống Do đó, tiết kiệm lượng lớn tài nguyên Tuy nhiên, việc không đưa vào liệu cụ thể nội dung gợi ý làm giảm tính xác hệ thống Ngoài ra, khó cho gợi ý sản phẩm hay mặt hàng đưa vào hệ thống sản phẩm chưa người người dùng tìm đến Một nhược điểm khác cách tiếp cận khả bị “SPAM” (ví dụ quảng cáo) đến từ tài khoản chạy hệ thống gửi message tự động Theo báo “A Survey of Collaborative Filtering Techniques”, hệ thống gợi ý dựa lọc cộng tác chia làm ba nhóm: Các hệ thống dựa nhớ (memory-based systems), hệ thống dựa mô hình (model-based systems) hệ thống kết hợp (hybrid systems – kết hợp mô hình với sở liệu thông tin người dùng) Các tác giả thảo luận thách thức hệ thống này, bao gồm, thưa thớt liệu, khả mở rộng, từ đồng nghĩa (các sản phẩm khác giống khác tên) “Shiling attacks” (các cá nhân tự đánh giá thứ hạng cao cho sản phẩm họ đánh giá thứ hạng thấp cho sản phẩm đối thủ) Cùng với đó, tác giả thảo luận nhiều phương pháp tính khoảng cách để xác định giống sản phẩm phương pháp lọc cộng tác 4 Học máy lọc theo nội dung Có nhiều lý khác để xây dựng hệ gợi ý Thứ nhất, hệ gợi ý khuyến khích người dùng hành động mua sản phẩm xem thử chương trình truyền hình cụ thể Thứ hai, giúp người dùng phát sản phẩm mà gợi ý họ tìm thấy Một lý khác giải toán “Quá tải thông tin” người dùng Nói cách khác, hệ thống lọc thông qua tập liệu lớn thể lựa chọn sản phẩm mà người dùng ưng ý Những việc thường gọi truy vấn thông tin lọc thông tin.Tuy nhiên, mục tiêu hệ gợi ý để phân loại liệu có liên quan không liên quan đến người dùng Tận dụng thông tin thu từ nội dung phần tử liệu để xếp hạng chúng thường gọi hệ gợi ý dựa nội dung (content-based recommendation) Về bản, phương pháp tiếp cận dựa nội dung sử dụng mô tả sản phẩm (được thu thập thủ công suy dẫn cách tự động) liệu người dùng chứa thông tin mức độ quan tâm người dùng đến mô tả phần tử liệu nói Dữ liệu người dùng đơn giản hát mà họ nghe, sở thích mô tả người dùng Phương pháp tiếp cận dựa nội dung cố gắng gợi ý sản phẩm giống với sản phẩm trước người sử dụng tương ứng tỏ quan tâm Để thực hiện, so sánh mức độ tương xứng thuộc tính mà người dùng quan tâm (được lưu liệu họ) thuộc tính mô tả sản phẩm Mục đích việc gợi ý sản phẩm mà người dùng quan tâm Ví dụ mô tả sản phẩm âm nhạc bao gồm thể loại, nhịp độ, nốt nhạc, phong cách, âm sắc, nhạc cụ, v.v… Những thông tin liên quan thu thập thủ công tự động cách trích chọn đặc trưng âm nhạc 1.2 Hệ gợi ý âm nhạc Các nghiên cứu trước Một vài phương pháp sử dụng lọc dựa nội dung dùng thành công Trong báo “A Music Recommendation System based on Music Data Grouping and User Interests,” nhạc đưa cách dùng thuộc tính nhận thức nhạc, bao gồm cao độ, trường độ độ to âm Các sở thích người dùng đưa vào lịch sử truy cập lưu vào hồ sơ liệu nhân người Dựa lịch sử truy cập, người dùng phân nhóm dựa sở thích họ không gian đặc trưng (feature space) Ba phương pháp gợi ý thử nghiệm để tìm người dùng có sở thích giống để gợi ý Trong báo, “A Music Search Engine Built upon Audio-based and Web-based Similarity Measures,” tác giả sử dụng đối xứng Kullback-Leibler phân kỳ để tính toán trung bình ma trận hiệp phương sai dựa MFCCs (phương pháp sử dụng bao phổ) cho tương quan âm nhạc Tập liệu bao gồm 12 601 nhạc Mục tiêu tác giả tạo công cụ tìm kiếm cho tập hợp nhạc lớn, để truy vấn liệu thông qua ngôn ngữ tự nhiên Công cụ sử dụng thẻ nhạc Last.fm Trong báo, “Evaluation of Distance Measures between Gaussian Mixture Models of MFCCs,” tác giả so sánh phương pháp, Kullback-Leibler, khoảng cách Earth Mover (Earth Mover's Distance) khoảng cách chuẩn hóa Euclide, tất dựa MFCC Việc tính toán dựa vào phân nhóm thể loại nhạc trang MIREX năm 2004 với 729 nhạc thuộc thể loại Kết cho thấy ba phương pháp cho kết tương tự Trong báo, “Song-level Features and Support Vector Machines for Music Classification,” tác giả so sánh phương pháp Kullback Leibler phân kỳ khoảng cách Mahalanobis dựa MFCC Việc tính toán thử nghiệm việc nhận biết nghệ sỹ thực cách tương đối tập liệu 1200 nhạc pop biểu diễn 18 nghệ sỹ Trong báo, “Lightweight Measures for Timbral Similarity of Musical Audio,” tác giả đề xuất phương pháp tính toán đơn giản dựa MFCC phù hợp với tập liệu lớn Các phương pháp đưa Kullback Leibler phân kỳ khoảng cách Mahalanobis Các phương pháp tính toán với nhóm thể loại nhạc ba tập liệu dựa kỹ thuật phân lớp láng giềng gần Ba tập liệu thử nghiệm gồm có tập liệu phân nhóm thể loại ISMIR năm 2004, tập liệu có 3600 nhạc, tập liệu khác lớn Các kết thu khẳng định phương pháp hoạt động tương tự Tập liệu Last.fm Last.fm dịch vụ âm nhạc hỗ trợ người dùng tìm nhạc dựa nhạc mà họ nghe Vào ngày 28/4/2014 Last.fm chấm dứt việc cung cấp dịch vụ streaming; nhiên công nghệ gợi ý trang sử dụng để tích hợp với dịch vụ streaming khác Trang web Last.fm chứa đựng lượng lớn thông tin nghệ sỹ, album, nhạc Đối với người dùng đăng ký làm thành viên, Last.fm cung cấp thông tin nhạc gần giống với nghệ sỹ thẻ đánh dấu chọn Người dùng đọc thông tin nghệ sỹ mà họ yêu thích, xem nghe nhạc phổ biến nghệ sỹ đó, duyệt album họ tìm hiểu nghệ sỹ giống với họ Người dùng tìm hiểu kiện âm nhạc tới, nghe nhạc phát xem video Điều khiến Last.fm trội so với hệ gợi ý âm nhạc khác, tham gia cộng đồng Phương pháp họ sử dụng dựa vào cộng tác 1.3 Kết luận chương Như chương tỉm hiểu nội dung học máy hệ gợi ý, số phương pháp lọc áp dụng hệ gợi ý; giới thiệu số nghiên cứu trước phương pháp áp dụng hệ gợi ý âm nhạc Ngoài chương giới thiệu tập liệu phổ biến âm nhạc Last.fm Trong chương tìm hiểu cụ thể phương pháp tiếp cận hệ gợi ý âm nhạc sử dụng luận văn 7 CHƯƠNG PHƯƠNG PHÁP GỢI Ý KẾT HỢP GIỮA LỌC CỘNG TÁC VÀ LỌC NỘI DUNG 2.1 Phương pháp luận Nếu sử dụng lọc cộng tác để gợi ý âm nhạc dẫn đến số hạn chế Hạn chế lớn việc, nhạc gắn thẻ đánh dấu mà người dùng phát nghe chúng Nói cách khác, có thẻ mô tả cho nhạc nhạc mà chưa có người dùng biết đến Ngoài ra, người nghe tỏ sẵn sàng gắn thẻ cho hát họ thích gắn thẻ cho hát họ thích không thích Bởi vậy, khó cho hệ thống sử dụng lọc cộng tác để cung cấp gợi ý xác số lượng thẻ đánh dấu đủ lớn cho nhạc Hệ gợi ý dựa nội dung dựa vào việc tự động trích chọn đặc trưng nhạc, đòi hỏi thời gian cần lượng tài nguyên lớn Nhưng trích chọn thủ công gặp vấn đề liên quan đến khả mở rộng Khi số lượng nhạc nhiều lên hệ thống trở nên phổ biến với người dùng, cần nhiều nguồn lực để phân tích nhạc Các thẻ đánh dấu nhạc người dùng cung cấp Các thẻ đánh dấu (“Collaborative tags” hay “social tags”) từ khóa rút gọn mô tả cho sản phẩm, hay nhạc trang dịch vụ âm nhạc, cung cấp cộng đồng mạng Hệ thống phát triển luận văn sử dụng thẻ đánh dấu âm nhạc từ trang Last.fm, để gợi ý nhạc dựa thẻ có sẵn từ hệ thống Trích chọn đặc trưng âm từ nhạc Các liệu MFCC đặc trưng trích chọn từ nhạc, dùng rộng rãi lĩnh vực nhận dạng giọng nói phân tích âm nhạc Trong hệ gợi ý luận văn này, việc trích chọn liệu MFCC thực phần mềm Sonic Annotator với phần mở rộng Vamp trường đại học Queen Mary Sonic Annotator chương trình mã nguồn mở chạy dòng lệnh để trích chọn đặc trưng âm từ nhiều tệp âm Để dễ hình dung trình trình trích chọn, luận văn sử dụng ứng dụng mã nguồn Sonic Visualiser để theo dõi phân tích nội dung bên tệp âm Phần mềm tương thích với Linux, OS/X Windows, phát triển Trung tâm nhạc kỹ thuật số Đại học Queen Mary, London Các giá trị để tìm tương quan nhạc Để đưa gợi ý thích hợp dựa nhạc người dùng lựa chọn, Hệ gợi ý cần phải so sánh giống nhạc gốc nhạc tập liệu Giá trị so sánh tính thẻ đánh dấu âm nhạc Luận văn sử dụng API “track.getTopTags” Last.fm thẻ đánh dấu tốt cho nhạc số lượng người dùng sử dụng thẻ để đánh dấu Trong luận văn này, việc tính toán số tương quan dựa cộng tác hai nhạc thực cách so sánh top 10 thẻ đánh dấu nhạc lấy từ Last.fm sử dụng khoảng cách Euclide có trọng số (weighted Euclidian distance) để tính toán khoảng cách hai hát thẻ đánh dấu cộng tác Dựa kết nghiên cứu trước đây, phương pháp tiếp cận cho kết tốt Chúng ta dùng trọng số để tính toán khoảng cách thẻ có tổng số lần đánh dấu khác Nói cách khác, thẻ nhiều người dùng sử dụng để đánh dấu gây ảnh hưởng lớn thẻ có người dùng đánh dấu Khoảng cách Euclide có trọng số dx,y(p,q) khoảng cách hai nhạc x y biểu diễn véc-tơ (p,q) tính với công thức sau 𝑑𝑥,𝑦 (𝑝, 𝑞) = √𝑤1 ⋅ (𝑝1 − 𝑞1 )2 + 𝑤2 ⋅ (𝑝2 − 𝑞2 )2 + +𝑤𝑛 ⋅ (𝑝𝑛 − 𝑞𝑛 )2 (2.1) Trong wi trọng số thẻ thứ i tính công thức sau wi = p i + q i (2.2) pi chuẩn hóa tổng số lần thẻ i đánh dấu (số đếm thẻ)cho nhạc x tính công thức (3) 𝑟 𝑝𝑖 = ∑𝑛 𝑖 𝑖=1 𝑟𝑖 (2.3) Trong ri tổng số lần thẻ i đánh dấu, số liệu lấy từ Last.fm Tương tự vậy, qi chuẩn hóa tổng số lần thẻ i đánh dấu (số đếm thẻ)cho nhạc y p q chuẩn hóa vector tổng số lần đánh dấu liên quan đến hai nhạc, nhạc truy vấn nhạc dùng để so sánh tương ứng Trong nghiên cứu nhạc thể tập mười thẻ đánh dấu lấy từ Last.fm Mỗi giá trị lấy trọng số cách nhân với tổng số đếm mười thẻ đánh dấu phổ biến nhạc nhạc Tập có khoảng cách nhỏ thuộc nhạc giống với bạn nhạc nghe 9 Giá trị so sánh tính tín hiệu âm Trong luận văn này, việc tính toán tương quan âm hai nhạc thực cách trích chọn giá trị phương sai trung bình từ Mel-Frequency Cepstral Coefficients (MFCC) tệp âm nhạc sử dụng khoảng cách Mahalanobis (Mahalanobis distance) để tính khoảng cách nhạc thuộc tính âm Phương pháp lựa chọn cách tiếp cận dễ hiểu nhất, cho kết tương đối tốt so với phương pháp tính toán khác mà nói Khoảng cách Mahalanobis Dx,y khoảng cách hai nhạc x y thể véc-tơ MFCC tương ứng chúng: 𝐷𝑥,𝑦 (𝑢, 𝑣 ) = (𝑢 − 𝑣 )𝑇 ⋅ ∑−1(𝑢 − 𝑣 ), (2.4) Trong Σ ma trận hiệp phương sai thuộc tính âm nhạc toàn tập liệu nhạc, coi ma trận đường chéo phương sai thuộc tính u v véc-tơ chứa giá trị trung bình giá trị phương sai MFCC giống hai nhạc tương ứng Trong luận văn này, trích xuất giá trị 20 MFCC Sonic Annotator Mỗi tệp âm xử lý frame (khung) với kích thước 2048 mẫu (46,4 ms tệp âm lâý mẫu tần số 44,1 kHz) với kích thước bước nhảy 1024 mẫu Theo cách xử lý này, tệp âm dài ba phút có khoảng 7750 frame, khung biểu diễn 20 MFCC Các MFCC tạo cho frame kết hợp lại cách tính toán trung bình phương sai 20 MFCC tương ứng với chúng Kết là, thuộc tính âm tệp âm biểu diễn hởi 40 giá trị: 20 giá trị trung bình 20 giá trị phương sai 20 MFCC Kết hợp thẻ đánh dấu đặc trưng âm Hệ gợi ý kết hợp đề xuất luận văn sử dụng so sánh dựa thẻ đánh dấu âm nhạc dựa kỹ thuật trích chọn đặc trưng tự động Như minh họa ví dụ trước, hệ gợi ý sử dụng kết khoảng cách từ giá trị tiền xử lý: khoảng cách Euclide có trọng số dx,y dựa thẻ âm nhạc từ Last.fm khoảng cách Mahalanobis Dx,y dựa liệu MFCC trích chọn từ tệp âm Sonic Annotator Trên thực tế, khoảng cách thẻ đánh dấu khoảng cách MFCC có chênh 10 lệch lớn giá trị, khoảng cách cần chuẩn hóa trước kết hợp lại với Để chuẩn hóa khoảng cách thẻ đánh dấu (Euclide có trọng số) 𝑑𝑥,𝑦 , ta sử dụng phương pháp chuẩn hóa tỉ lệ thập phân (decimal scaling normalization) cách chia khoảng cách Euclide có trọng số cho khoảng cách Euclide có trọng số tối đa 𝑑𝑥,𝑦 = 𝑑𝑥,𝑦 , (2.5) 𝑚𝑎𝑥{𝑑𝑥𝑖 ,𝑦𝑗 } Trong dx,y khoảng cách Euclide có trọng số nhạc x nhạc y tính công thức (2.1) dxi,yj biểu diễn khoảng cách Euclide lớn tất nhạc tập liệu Tương tự vậy, chuẩn hóa khoảng cách MFCC (Mahalanobis) 𝐷𝑥,𝑦 chuẩn hóa tỷ lệ thập phân với công thức sau: 𝐷𝑥,𝑦 = 𝐷𝑥,𝑦 , (2.6) 𝑚𝑎𝑥{𝐷𝑥𝑖 ,𝑦𝑗 } Khoảng cách kết hợp C(x,y) hai nhạc x y tính toán cách tổ hợp hai số đo khoảng cách dựa thẻ đánh dấu đặc trưng âm nhạc: 𝐶 (𝑥, 𝑦) = ( 𝑑𝑥,𝑦 −𝑑𝑥,1 𝑑𝑥,20 −𝑑𝑥,1 + 𝐷𝑥,𝑦 −𝐷𝑥,1 𝐷𝑥,20 −𝐷𝑥,1 ) (2.7) Trong 𝑑𝑥,𝑦 chuẩn hóa khoảng cách Euclide có trọng số hai nhạc x y, 𝑑𝑥,1 chuẩn hóa giá trị khoảng cách nhỏ nhạc x toàn nhạc sở liệu, 𝑑𝑥,20 chuẩn hóa khoảng cách nhỏ thứ 20 nhạc x nhạc sở liệu Tương tự với 𝐷𝑥,𝑦 chuẩn hóa MFCC (Mahalanobis) nhạc x y Trong trường hợp không tồn khoảng cách Euclide hai nhạc, mà hai nhạc thẻ đánh dấu từ Last.fm, khoảng cách tổ hợp C(x,y) nhạc x y phụ thuộc vào khoảng cách MFCC 𝐶 (𝑥, 𝑦) = 𝐷𝑥,𝑦 −𝐷𝑥,1 𝐷𝑥,20 −𝐷𝑥,1 (2.8) 11 Cuối cùng, hệ thống đưa số gợi ý nhạc, nhạc thể tên nhạc tên nghệ sỹ Những gợi ý xếp theo thứ tự ưu tiên từ hát có giá trị giống cao nhất, giá trị khoảng cách nhỏ giá trị giống cao 2.2 Kết luận chương Chương trình bày cụ thể phương pháp tiếp cận sử dụng hệ gợi ý luận văn Đó kết hợp hai phương pháp mang lại hiệu cho hệ gợi ý phương pháp lọc cộng tác phương pháp lọc nội dung Ngoài chương đưa ví dụ cụ thể cho phương pháp, bước tính toán để hình thành liệu so sánh Các bước tính toán số liệu so sánh sử dụng để đưa vào chương trình ứng dụng xây dựng luận văn Chương III trình bày cụ thể bước xây dựng, công nghệ sử dụng ứng dụng kết thử nghiệm hệ thống 12 CHƯƠNG XÂY DỰNG HỆ THỐNG GỢI Ý CHO WEBSITE NGHE NHẠC TRỰC TUYẾN 3.1 Giới thiệu toán Luồng liệu hệ thống gợi ý mô tả hình 3.1 Cơ sở liệu chứa thông tin khoảng 1000 nhạc: tệp âm mp3 siêu liệu chúng (tên nhạc, nghệ sỹ tên tệp) Tên nhạc nghệ sỹ dùng để trích chọn thẻ đánh dấu tạo cộng đồng (những thẻ đánh dấu phổ biến nhất) từ API Last.fm có tên track.getTopTags Tệp âm dùng để trích chọn liệu MFCC (các đặc trưng âm thanh) từ Sonic Annotator Thiết kế hệ thống Công việc xây dựng hệ thống chia nhỏ thành bước bảng 3.1 Trước hết việc thu thập số lượng nhạc đủ lớn Sử dụng hệ sở liệu SQL Server để thiết kế sở liệu có quan hệ Hình 3.1: Luồng liệu hệ thống Hình 3.1 mô tả cấu trúc quan hệ thực thể sở liệu hệ thống Bảng tbl_Song nơi lưu trữ siêu liệu từ nhạc mp3 lưu hệ thống Dữ liệu liên quan đến thẻ nhớ nhạc lấy từ Last.fm Các liệu MFCC trích xuất từ tệp âm nhạc lưu vào bảng tbl_mfccData Các giá trị khoảng cách dựa phương pháp lọc cộng tác, lọc dựa nội dung phương pháp kết hợp lưu vào bảng 13 tbl_similar Đánh giá người dùng thu thập từ người tham gia thử nghiệm sản phẩm lưu ẩn danh vào bảng tbl_session Bảng 3.1 Các công việc cần thực Công việc cần thực Chi tiết công việc Thu thập nhạc mp3 Tìm nhạc mạng internet Thiết kế sở liệu Sử dụng SQL Server để thiết kế bảng tạo quan hệ Thu thập siêu liệu từ Loại bỏ liệu trùng, đưa siêu liệu tệp mp3 vào sở nhạc liệu Thu thập thẻ đánh dấu cho Sử dụng ASP.NET phát triển nghiệp vu lấy chuỗi giá trị từ API nhạc Last.fm, thu 10 thẻ gợi ý phổ biến hát đưa chúng vào sở liệu Thu thập liệu đặc trưng Tùy chỉnh tệp batch sử dụng Sonic Annotator để trích xuất liệu MFCC âm nhạc xuất file CSV Tính toán giá trị so sánh Sử dụng ASP.NET phát triển nghiệp vụ tính toán khoảng cách giải thuật lọc cộng tác tất Euclide có trọng số dựa thẻ gợi ý nhạc sở liệu Tính toán giá trị so sánh Sử dụng ASP.NET phát triển nghiệp vụ tính toán khoảng cách giải thuật trích chọn đặc trưng âm Mahalanobis dựa liệu MFCC nhạc tất nhạc sở liệu Tính toán giá trị so sánh kết Sử dụng ASP.NET phát triển nghiệp vụ tính toán khoảng cách kết hợp dựa hợp tất nhạc chuẩn hóa hai giá trị sở liệu Thiết kế website để Phát triển giao diện người dùng HTML5, CSS, JavaScript jQuery người tham gia thử nghiệm sản phẩm 14 Hình 3.2: Các bảng quan hệ sở liệu Tiếp theo, phát triển nghiệp vụ để tải sở liệu thẻ đánh dấu từ Last.fm, liệu MFCC Phát triển nghiệp vụ tính toán giá trị so sánh đưa vào bảng tbl_similar Cuối phát triển ứng dụng Web cho phép người dùng truy cập sử dụng hệ gợi ý Ứng dụng Web Hình 3.3 mô tả trang chủ ứng dụng web Người dùng sử dụng công cụ tìm kiếm để tìm nhạc tên hát tên nghệ sỹ, xếp theo thứ tự tên nhạc tên ca sỹ Khi người dùng chọn nút “Gợi ý nhạc” họ xem danh sách nhạc hệ thống gợi ý Căn theo nhạc mà người dùng nghe, hệ thống đưa danh sách hình 3.4 Trong nhạc đưa gợi ý, nhạc dựa lọc cộng tác, nhạc dựa lọc dựa nội dung nhạc dựa phương pháp kết hợp, hệ thống chủ đích đưa nhạc với giá trị so sánh thấp dựa vào phương pháp kết hợp (gợi ý tồi) Các nhạc gợi ý tính toán đưa nghiệp vụ độc lập với nhau, xảy trường hợp trùng nhạc gợi ý, tất trường hợp ghi nhận Người dùng nhạc gợi 15 ý phương pháp Người dùng nghe nhạc gợi ý nghe lại nhạc gốc Sau nghe xong nhạc, người dùng đánh giá tương đồng nhạc gợi ý nhạc gốc theo thang điểm từ đến 5, điểm giống điểm khác so với nhạc gốc Sau người dùng chấm điểm, liệu đánh giá đưa vào sở liệu Hình 3.3: Trang chủ ứng dụng Hình 3.4: Trang gợi ý ứng dụng Người dùng truy vấn nhạc từ sở liệu Với thẻ đánh dấu MFCC, giá trị so sánh tính toán cách so sánh liệu nhạc mà người dùng nghe liệu nhạc khác sở liệu Một giá trị kết hợp 16 tính toán dựa giá trị so sánh thẻ đánh dấu giá trị so sánh MFCC Một danh sách nhạc gợi ý hệ thống đưa dựa nhạc mà người chơi nghe Để đánh giá hệ thống gợi ý luận văn này, chương trình tổ chức phương pháp gợi ý: phương pháp sử dụng gợi ý dựa lọc cộng tác từ thẻ đánh dấu Last.fm, phương pháp sử dụng trích chọn đặc trưng âm (lọc dựa nội dung), phương pháp sử dụng phương pháp kết hợp hai phương pháp Cả ba phương pháp đánh giá việc lấy ý kiến người dùng mức độ giống nhạc nghe nhạc gợi ý hệ thống 3.2 Thử nghiệm hệ thống Để chứng minh hệ thống đem lại hài lòng cho người dùng, thí nghiệm thực Tất thành viên công ty iMicrosoft tham gia thử nghiệm Mỗi người dùng truy cập vào ứng dụng Web truy vấn nhạc có sở liệu, hệ thống cung cấp 12 nhạc gợi ý bao gồm gợi ý dựa lọc cộng tác, gợi ý dựa lọc theo nội dung, gợi ý dựa vào phương pháp kết hợp gợi ý tồi dựa vào phương pháp kết hợp 3.3 Kết thực nghiệm giải thích kết Điểm trung bình cho kết gợi ý (thang điểm từ 1-5) Gợi ý dựa vào thẻ đánh dấu Gợi ý dựa vào mfcc Gợi ý kết hợp Gợi ý tồi dựa phương pháp kết hợp Hình 3.5: Kết đánh giá hệ thống 17 Phương pháp lọc cộng tác dựa thẻ đánh dấu nhận điểm trung bình 3,6 điểm số cao bốn kết gợi ý Tiếp theo phương pháp kết hợp dựa lọc cộng tác lọc nội dung có điểm trung bình 3,3 Phương pháp gợi ý dựa nội dung đặc trưng âm vị trí thứ với điểm trung bình 2,8 Cuối dự đoán, gợi ý tồi nhận điểm trung bình 1,5 Bảng 3.2 chứa nội dung chi tiết ví dụ rút từ thực nghiệm để làm bật khả hệ gợi ý âm nhạc dựa phương pháp kết hợp Cả ví dụ đưa phương pháp kết hợp Bảng 3.2 ví dụ rút từ thực nghiệm Bản nhạc chọn Tên Nghệ sỹ nhạc Bản nhạc gợi ý Tên nhạc Until the Justin Twenty End of Timberlake Foreplay Time Just Got Dokken Lucky Mama Weer All Crazee Now Baby One More Time Britney Spears Autumn Leaves Cannonball Adderley Song for Feat Miles My Father Davis Rumour Has It Adele Crash Điểm đánh giá Những đặc điểm giống Những thẻ đánh dấu giống Nghệ sỹ Janet Jackson Quiet Riot Gwen Stefani Horace Silver Rolling in the Adele Deep Thể loại giống (slow R&B), khóa nhạc (Si thứ), chùm hợp âm giống nhau, âm sắc giống (nhạc cụ/giọng hát) Thể loại giống (hard rock), Cùng nhịp độ (138), khóa (Đô thăng trưởng Rê trưởng), âm sắc (tiếng guitar điện) Thể loại giống (pop), nhịp trống giốn nhau, âm sắc giống (tiếng bass, giọng hát) pop, r&b, sexy, soul hard rock, heavy metal, hair metal, 80s pop, dance, female vocalists, sexy Thể loại giống (cool jazz), âm sắc giống (nhạc cụ) jazz Thể loại giống (soul / pop), same artist/band (Adele), nhịp trống giống nhau, âm sắc giống (nhạc cụ/giọng hát) soul, pop, Adele, female vocalists, British, singersongwriter Trong ví dụ đầu tiên, nhạc “Until the End of Time” Justin Timberlake nhạc chọn nghe, nhạc “Twenty Foreplay” Janet Jackson gợi ý Khi 18 phân tích hai nhạc, nhận hai nhạc có thể loại, khóa nhạc, có chuỗi hợp âm giống nhau, âm sắc giống Bản nhạc Janet Jackson gợi ý hệ gợi ý kết hợp hai lý do: hai nhạc có thẻ đánh dấu: pop, r&b, sexy soul, có đặc trưng âm Xét cách tổng thể, dùng phương pháp kết hợp, người dùng có nhiều khả khám phá nhạc (mà chưa biết đến) phương pháp không dựa hoàn toàn vào lọc cộng tác 3.4 Kết luận chương Trong Chương 3, trình bày bước xây dựng hoàn thiện ứng dựng hệ gợi ý âm nhạc dựa phương pháp kết hợp phương pháp trình bày chương Chương đưa phương pháp thử nghiệm hệ thống, cách tiếp cận thu thập ý kiến người dùng nhằm mục đích đánh giá khả hoạt động hệ thống 19 KẾT LUẬN Kết đạt hạn chế Dựa vào kết phân tính liệu từ thực nghiệm Phương pháp gợi ý dùng lọc cộng tác thẻ đánh dấu cho kết đánh giá tốt Điều giải thích vài lý Trước hết, trang Last.fm có hàng triệu người dùng đăng ký sử dụng Điều giúp tăng hiệu gợi ý, kết tỷ lệ thuận với số người sử dụng Tuy nhiên, thẻ gợi ý chủ yếu liên quan đến tên nhạc, tên nghệ sỹ tên album nhạc Điều ảnh hưởng đên việc chấm điểm người tham gia thực nghiệm, thông thường nhạc có nghệ sỹ biểu diễn thường đánh giá giống Mục tiêu phương pháp gợi ý âm nhạc kết hợp sử dung lọc cộng tác lọc nội dung nhìn chung thành công hướng theo yêu cầu đặt Tuy nhiên gợi ý xác tập liệu có khoảng 500 nhạc thiếu đa dạng Trong ví dụ này, nhạc chọn nghe nhạc jazz, medium-swing có chủ đề giáng sinh biểu diễn Ellas Fitzgerald Đây nhạc Ella Fitzgerald tập liệu Ngoài ra, nhiều nhạc jazz, medium-swing, tập liệu Trên thực thế, có khoảng 3,8% nhạc tập liệu có thẻ đánh dấu jazz Điều dẫn đến việc kết gợi ý không xác Ví dụ, gợi ý phương pháp kết hợp “What Christmas Means to Me” biểu diễn Hanson thiên thể loại pop-rock Bản nhạc gợi ý chủ yếu là nhạc giáng sinh Những gợi ý hai phương pháp lại gặp vấn đề tương tự Bản nhạc gợi ý dựa thẻ đánh dấu, “Christmas Time” biểu diển Backstreet Boys thể loại pop-rock Bản nhạc gợi ý lý ca khúc giáng sinh Bản nhạc gợi ý trích chọn đặc trưng âm nhạc, “Know You Now” Amy Winehouse thuộc thể loại R&B Bản nhạc gợi ý vị Amy Winehouse có quãng chất giọng gần giống với Ella Fitzgerald Nhưng nhạc không giống với nhạc nghe Cụ thể hơn, chúng hoàn toàn khác thể loại nhịp điệu Hướng phát triển Định hướng phát triển tiếp theo, trước hết mở rộng tập liệu, tăng đa dạng thể loại số lượng nhạc Việc giúp tăng số đo mức độ giống góp phần làm tăng xác nhạc gợi ý Tổng quát, phương pháp lọc nội dung tự động trích chọn thuộc tính MFCC 20 thể tốt Nhưng lại xác số ba phương pháp thử nghiệm Lý phương pháp xét đến tần số âm Hệ thống tương lai mở rộng thêm số đặc trưng âm nhạc khác nhạc cụ nhịp điệu Để phục vụ cộng đồng người dùng, hệ thống phải có thêm tính động, tự động cập nhật sở liệu thẻ gợi ý mới, nhạc điều chỉnh số dựa tập liệu cập nhật Ngoài ra, hệ thống có khả tự động điều chỉnh gợi ý dựa hành vi người dùng Điều làm giúp hệ gợi ý trở nên cá nhân hóa cho người sử dụng 21 TÀI LIỆU THAM KHẢO [1] C H Chuan (2013), “Audio Classification and Retrieval Using Wavelets and Gaussian Mixture Models”, Multimedia Engineering and Management, International Journal of, vol 4, issue [2] H C Chen, A.L Chen (2001), “A Music Recommendation System Based on Music Data Grouping and User Interests”, Information and Knowledge Management, 10th ACM International Conference on, pp 231-238 [3] W W Cohen, W Fan (2000), “Web-collaborative Filtering: Recommending Music by Crawling the Web”, Computer Networks, vol 33, no 1, pp 685-698 [4] M.M Deza, E Deza (2009), Encyclopedia of Distances, Springer, New York, pp 94 [5] D Eck, P Lamere, T Bertin-Mahieux, S Green (2008) “Automatic Generation of Social Tags for Music Recommendation”, Advances in Neural Information Processing Systems, pp 385-392 [6] S.A Golder, B A Huberman (2006), “Usage Patterns of Collaborative Tagging Systems”, Journal of Information Science, vol 32, pp 198–208 [7] J Jenson, D Ellis, M Christensen, S Jensen (2007), “Evaluation of Distance Measures between Gaussian Mixture Models of MFCCs”, 8th International Conference on Music Information Retrieval, pp 107-108 [8] P Knees, T Pohle, M Schedl, G Widmer (2007), “A Music Search Engine Built upon Audio-based and Web-based Similarity Measures”, International ACM SIGIR Conference on Research and Development in Information Retrieval, pp 447-454 [9] M Levy, M Sandler (2006), “Lightweight Measures for Timbral Similarity of Musical Audio”, 1st ACM Workshop on Audio and Music Computing Multimedia [10] M Levy, M Sandler (2009), “Music Information Retrieval Using Social Tags and Audio”, IEEE Transactions on Multimedia, vol 11, no 3, pp 383-395 [11] M Mandel, D Ellis (2005), “Song-Level Features and Support Vector Machines for Music Classification”, 6th International Conference on Music Information Retrieval, pp 594-599 [12] X Su, T Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques”, Advances in Artificial Intelligence [13] X Wu, L Zhang, Y Yu (2006), “Exploring Social Annotations for the Semantic Web”, 15th International Conference on World Wide Web, pp 417-426 [14] http://www.Last.fm/, truy cập ngày 26/9/2016 [15] http://www.vamp-plugins.org/sonic-annotator/, truy cập ngày 26/9/2016 [16] http://www.sonicvisualiser.org/, truy cập ngày 26/9/2016 22 ... ứng dụng xây dựng hệ gợi ý âm nhạc , nhằm cung cấp nhìn phương pháp học máy gợi ý âm nhạc, phân tích, so sánh phương pháp lựa chọn phương pháp để xây dựng hệ thống gợi ý cho website nghe nhạc trực... dung học máy hệ gợi ý, số phương pháp lọc áp dụng hệ gợi ý; giới thiệu số nghiên cứu trước phương pháp áp dụng hệ gợi ý âm nhạc Ngoài chương giới thiệu tập liệu phổ biến âm nhạc Last.fm Trong. .. quan học máy hệ gợi ý Chương 2: Phương pháp gợi ý kết hợp lọc cộng tác lọc nội dung Chương 3: Xây dựng hệ thống gợi ý cho website nghe nhạc trực tuyến Phần kết luận CHƯƠNG TỔNG QUAN VỀ HỌC MÁY TRONG

Ngày đăng: 27/04/2017, 13:49

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan