Xây dựng hệ thống dự đoán thuê bao rời mạng của mobifone dựa vào mạng nơ ron

65 950 1
Xây dựng hệ thống dự đoán thuê bao rời mạng của mobifone dựa vào mạng nơ ron

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ronXây dựng hệ thống dự đoán thuê bao rời mạng của Mobifone dựa vào mạng nơ ron

1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - TRẦN THANH GIẢNG XÂY DỰNG HỆ THỐNG DỰ ĐOÁN THUÊ BAO RỜI MẠNG CỦA MOBIFONE DỰA VÀO MẠNG NƠ RON LUẬN VĂN THẠC SĨ KỸ THUẬT TP HỒ CHÍ MINH – NĂM 2016 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - TRẦN THANH GIẢNG LỜI CAM ĐOAN XÂY DỰNG HỆ THỐNG DỰ ĐOÁN THUÊ BAO RỜI MẠNG CỦA MOBIFONE Tôi cam đoan công trình nghiên cứu riêng DỰA VÀO MẠNG NƠ RON Các số liệu, kết trình bày luận văn trung thực chưa NGÀNH: HỆ THỐNG THÔNG TIN công bố bấtCHUYÊN kỳ công trình khác MÃ SỐ: 60.48.01.04 Tp HCM, 20 tháng 06 năm 2016 Học viên thực luận văn LUẬN VĂN THẠC SĨ KỸ THUẬT Trần Thanh Giảng NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS DƯƠNG TUẤN ANH TP HỒ CHÍ MINH – NĂM 2016 LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS Dương Tuấn Anh hướng dẫn nhiệt tình, tận tâm suốt trình giúp thực luận văn Thầy giúp cho định hướng, phương pháp nghiên cứu, tài liệu bổ ích đặt biệt kinh nghiệm quý giá Tôi xin chân thành cảm ơn Học Viện Công Nghệ Bưu Chính Viễn Thông tạo điều kiện đặc biệt gửi lời cám ơn sâu sắc tới Thầy, Cô tận tụy hướng dẫn, giúp đỡ truyền dạy kiến thức quý báu, bổ ích cho suốt khóa học, để áp dụng vào công việc lĩnh vực công nghệ thông tin, hoàn thành luận văn Cảm ơn bạn học viên lớp Cao học Hệ thống thông tin 2014-2016 gắn bó, đoàn kết chia sẻ kinh nghiệm, giúp đỡ trình học tập suốt trình thực luận văn Tp HCM, 20 tháng 06 năm 2016 Học viên thực luận văn Trần Thanh Giảng MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Viết tắt Tiếng Anh SPSS Statistical Tiếng Việt Product and Phần mềm SPSS Services Solutions CDR Call Detail Recording Chi tiết gọi Mạng Nơ ron Neuron Network Mạng Nơ ron KPDL Data Mining Khai phá liệu MLP MultiLayer Perceptron Mạng Nơ ron đa lớp truyền thẳng CSDL Database Cơ sở liệu DANH SÁCH HÌNH VẼ DANH SÁCHBẢNG MỞ ĐẦU Nền kinh tế giới chuyển qua giai đoạn kinh tế tri thức, thông tin đóng vai trò quan trọng Tất thông tin khách hàng, thông tin giao dịch… số hóa lưu trữ hệ thống thông tin công ty tổ chức Thông tin chiết lọc từ liệu đóng vai trò quan trọng việc lãnh đạo đưa hoạch định chiến lược tổ chức, hay đơn giản điều chỉnh chuyên môn nghiệp vụ cho đạt hiệu Dữ liệu từ hoạt động kinh tế lưu trữ ngày phong phú, đa dạng nội dung, hình thức đầy đủ mặt dung lượng Đó ưu cho việc chiết lọc, khai phá liệu thô để đưa thông tin hữu ích, thách thức lớn đặt ra: làm để xử lý liệu lớn, phức tạp vậy, hay phong phú liệu nội dung hình thức khiến bối rối việc định bỏ loại liệu gì, lấy liệu Ngành viễn thông không dây (cùng với điện thoại di động không dây) đời năm đầu thập niên 90 kỷ 20 mở cách mạng mạnh mẽ việc liên lạc nói riêng, cách thức giao tiếp, truyền thông nói chung Và thực từ năm 2000 đến nay, với tiến nhanh thiết bị mạng viễn thông cho phép truyền liệu với tốt độ cao hơn; tiến công nghệ thông tin sản xuất thiết bị điện thoại di động cho phép người ta làm nhiều thứ điện thoại di động thay có nhắn tin gọi điện đơn Sự phát triển ngành viễn thông, công nghệ thông tin (gọi chung ngành ICT) mở cạnh tranh khốc liệt nhà sản xuất thiết bị di động cầm tay – smartphone; nhà cung cấp dịch vụ thông tin di động Mỗi nhà mạng có chiến lược để: phát triển giành giật khách hàng, cung cấp dịch vụ tốt hấp dẫn đặc biệt giữ khách hàng Một yếu tố quan trọng để giữ khách hàng cần biết đặc tính tất khách hàng (thuộc tính), ví dụ khách hàng thuộc độ tuổi nào, giới tính, thói quen sử dụng dịch vụ (sử dụng cước bao nhiêu, thường sử dụng dịch vụ gì…) Từ thuộc tính cần phải xem lại liệu lịch sử khách hàng khách hàng rời mạng Từ rút kết luận tính chất khách hàng rời mạng khứ, tính chất cụ thể hóa mô hình dự đoán thuê bao rời mạng Khi biết thuê bao rời mạng nhà mạng có tác động đến khách hàng để hạn chế thuê bao rời mạng CHƯƠNG - TỔNG QUAN 1.1 Tổng quan vấn đề cần nghiên cứu Từ mạng điện thoại không dây đời, khách hàng sử dụng số thuê bao để liên lạc thói quen sử dụng dịch vụ họ mang tính cá nhân, việc nghiên cứu thói quen sử dụng dịch vụ công ty viễn thông trọng Hiện nay, giới có nhiều công trình để giải toán dự đoán thuê bao rời mạng điện thoại di động không dây Hầu hết công trình sử dụng công nghệ khai phá liệu khai phá liệu “cây định” (Decision Tree), “kỹ thuật mạng nơ ron” (Neural Network Techniques) Dựa vào nghiên cứu thị trường (Berson, Smith & Thearling, năm 2000) [2], tỉ lệ rời mạng công ty điện thoại di động khoảng 2% tháng Như năm khoảng 25% (một phần tư) Trong đó, tỉ lệ rời mạng châu Á khoảng 48% (theo nghiên cứu Mattersion, 2001) Nghiên cứu rõ, việc tiên đoán thuê bao rời mạng phần quan trọng công tác quản lý quan hệ khách hàng (CRM - Customer Relationship Management) Tại châu Á, báo “Applying data mining to telecom churn management” tác giả Đài Loan (Shin-Yuan Hung, David C Yen, Hsiu-Yu Wang, năm 2006) đề mô hình tiên đoán thuê bao rời mạng dựa vào thông tin tổng quan khách hàng, thông tin tính cước, trạng thái hợp đồng dịch vụ, chi tiết gọi lịch sử thay đổi dịch vụ khách hàng [3] Trong báo “A Neural Network based Approach for Predicting Customer Churn in Cellular Network Services” [4] đồng tác giả Anuj Sharma Kumar Panigrahi Viện quản lý công nghệ Ấn Độ năm 2011 rõ việc sử dụng kỹ thuật mạng nơ ron cách tiếp cận việc dự đoán khách hàng di động rời mạng Bài báo rõ, tỉ lệ dự đoán khách hàng rời mạng khoảng 92% Bài báo “Predicting Customer Churn in Telecom Industry using Multilayer Perceptron Neural Networks Modeling and Analysis” tác giả Omar Adwan, Hossam Faris, Khalid Jaradat, Osama Harfoushi, Nazeeh Ghatasheh năm 2014 lần khẳng định dùng mạng nơ ron đa tầng (3 tầng) để xây dựng mô hình toán tiên đoán thuê bao rời mạng [5] Trong luận văn tiến hành nghiên cứu lý thuyết khai phá liệu (bao gồm mạng nơ ron định), nghiên cứu thuộc tính khách hàng MobiFone khứ, xây dựng tập thuộc tính khách hàng khứ, từ tập liệu thuê bao khứ xây dựng mô hình dự đoán thuê bao rời mạng hay không, sau dựa vào tập liệu thuê bao rời mạng khác khứ để xác định độ xác mô hình định việc áp dụng có áp dụng mô hình thực tế hay không? Đây vấn đề áp dụng kỹ thuật khai phá liệu vào việc phục vụ mục đích kinh doanh nên đề tài có ý nghĩa thực tiễn Cách tiếp cận vấn đề việc xây dựng mô hình dự đoán quan trọng, định việc nghiên cứu đề tài có hữu ích hay khôngCác công trình nghiên cứu liên quan 1.2 Lý chọn đề tài Việc sử dụng kiến thức lý thuyết khai phá liệu (Data Mining) vào việc khai phá, chắt lọc liệu để rút kết luận định hướng hoạt động kinh doanh ngành viễn thông áp dụng nhiều công ty viễn thông giới; công ty viễn thông đổ nhiều công sức tiền bạc vào vấn đề Theo tìm hiểu Việt Nam, công ty viễn thông, nhà cung cấp dịch vụ viễn thông (truyền hình, thông tin di động, Internet…) lớn chưa có công ty thực hệ thống dự đoán thuê bao (khách hàng) rời mạng (rời bỏ dịch vụ) mà công ty cung cấp Xuất phát từ việc đó, mạnh dạn nghiên cứu đề tài “Xây dựng hệ thống dự đoán thuê bao rời mạng MobiFone dựa vào mạng nơ ron” Tất nhiên hệ thống dự đoán áp dụng cho công ty viễn thông có hệ thống khách hàng, miễn có thay đổi cách tiếp cận khách hàng cho phù hợp, với nguồn liệu có khảo sát từ mạng điện thoại di động MobiFone xây dựng hệ thống dựa liệu khách hàng thực tế thu thập từ công ty MobiFone 10 1.3 Những kết đạt luận văn Luận văn bao gồm chương Chương 1: Tổng quan vấn đề cần nghiên cứu Chương tìm hiểu tổng quan vấn đề mà luận văn cần nghiên cứu, công trình có liên quan, phát biểu toán Chương 2: Các sở lý luận Các sở lý luận – lý thuyết liên quan để giải luận văn bao gồm: kiến thức khai phá liệu (data mining), mạng nơ ron, mạng nơ ron đa lớp truyền thẳng, thuật toán xây dựng mạng nơ ron, mô hình để giải toán dự đoán Chương 3: Khảo sát sở liệu thuê bao Mobifone Chương 4: Hiện thực, đánh giá, kết luận hướng nghiên cứu tương lai 51 Hình 4.7: Partition (phân nhóm liệu huấn luyện) Sau chia nhóm xong, sử dụng mô hình mạng nơ ron để huấn luyện tập thuê bao (sau loại bỏ hai trường không quan trọng), mà sau gọi mô hình mạng nơ ron lần Chúng chọn mô hình mạng mơ ron với thông số thiết lập hình 4.8: Hình 4.8: Dùng mô hình mạng nơ ron đa lớp truyền thẳng Chúng ta thấy, phần mềm cho phép chọn mô hình mạng nơ ron Multilayer Perceptron (MLP) – mô hình mạng nơ ron đa lớp truyền thẳng Về số lớp ẩn mạng nơ ron cấu hình phần mềm tự chọn số lượng lớp ẩn Ngoài phần mềm cho phép cấu hình có chọn số lớp ẩn thứ thứ hai hay không Việc cấu hình mạng nơ ron cho phép tùy biến Chúng ta để ý là, tất thông số có ảnh hưởng đến cách thức vận hành thuật toán mạng nơ ron đa lớp truyền thẳng thiết lập xem thông số đầu vào mô hình Việc sử dụng chức mạng nơ ron phần mềm SPSS giúp cho người dùng che vấn đề kỹ thuật phức tạp, tạo mạng nơ ron để giải toán cụ thể Để thực việc phần mềm SPSS mô lại cách thức giải toán mạng nơ ron dựa vào thuật toán mà nêu chương hai Ngoài phần mềm SPSS nhiều phần mềm khác hỗ trợ giải toán khai phá liệu 52 Hình 4.9: Lựa chọn thông số mạng nơ ron lần Hình 4.9 tiếp tục mô tả việc thiết lập thông số cho mạng nơ ron lần thời gian để huấn luyện, số lần lặp lại tỉ lệ bảo vệ overfit Chúng chọn thời gian tối đa để huấn luyệnlà 15 phút, tức thời gian để thực việc huấn luyện lặp lặp lại để chọn hệ số mạng nơ ron lớn 15 phút Số lần lặp lại là250, nghĩa ghi đưa vào giải thuật huấn luyện 250 lần để điều chỉnh trọng số Ngoài chọn tỉ lệ bảo vệ overfit 30% Sau chạy mô hình mạng nơ ron lần 1, đạt kết trình bày hình 4.10 Trường liệu mục tiêu ROIMANG, có 10 trường liệu gọi INPUT, số ghi 150.000 ghi, 70% dùng cho huấn luyện, 30% dùng cho kiểm thử Chúng dùng mô hình mạng nơ ron đa lớp truyền thẳng, số biến lớp ẩn 8, tỉ lệ xác 90,8% Trong trình chạy không phát sinh lỗi 53 Hình 4.10: Kết thực nghiệm sử dụng mạng nơ ron lần Hình 4.11 4.12 mô tả kết chi tiết độ xác số ghi sau lần sử dụng mạng nơ ron lần Với ghi có trường liệu mục tiêu ROIMANG có 87,0% ghi dự đoán (nghĩa dự đoán trường liệu mục tiêu 0), có 13,0% ghi dự đoán sai (nghĩa dự đoán trường liệu mục tiêu 1) Hình 4.11: Kết chi tiếtvề độ xác sử dụng mạng Nơ ron lần Với ghi có trường liệu mục tiêu ROIMANG có 6,1% ghi dự đoán sai (nghĩa dự đoán trường liệu mục tiêu 0), có 93,9% ghi dự đoán (nghĩa dự đoán trường liệu mục tiêu 1) 54 Hình 4.12: Kết chi tiết theo số ghi mạng Nơ ron lần Hình 4.13: Cấu hình mạng Nơ ron kết lần (để biên tập liệu) Hình 4.13 mô tả cấu hình mạng nơ ron kết lần Chúng ta thấy số lượng biến đầu vào 10, số lượng node lớp ẩn 9, kết đầu trường mục tiêu ROIMANG 55 Sau lần phân lớp mạng nơ ron lần để biên tập liệu, kết chi tiết số ghi trình bày hình 4.14 Trong cột có tiêu đề $N-ROIMANG mang giá trị thuê bao liên quan đến ghi phân lớp rời mạng cột mang giá trị thuê bao liên quan đến ghi không rời mạng Hình 4.14: Kết chi tiết theo ghi Tất liệu ghi với kết vừa tạo ra, kết xuất thành file liệu loại excel text để phục vụ cho việc áp dụng thực tế 4.3.5 Kiểm tra mô hình vừa tạo - biên tập liệu sau kiểm tra Sau chạy mạng nơ ron lần để biên tập liệu, thấy có 9,2% số ghi bị phân lớp chưa Đây kết nhiễu thực mạng nơ ron lần Chúng sử dụng tiếp mô hình mạng nơ ron lần cho 90,8% ghi sau loại bỏ ghi bị phân lớpchưa xác Việc làm tăng độ xác cho công việc phân lớp chúng tôi, đề cập đầu chương (mục 4.1) Chúng sử dụng công cụ phần mềm SPSS để thực công việc sau: 56 - Loại bỏ chỉgiữ lại ghi liệu có trường dự đoán ($N-ROIMANG) trường rời mạng thực (ROIMANG)bằng (tức ghi phân lớp đúng) - Loại bỏ hai trường liệu dự đoán (($N-ROIMANG ($NC-ROIMANG) - Tạo mạng nơ ron phân lớp lần thứ cho số ghi biên tập Chúng lấy kết cuối Sau chạy mô hình mạng nơ ron lần 2, đạt kết trình bày hình 4.15 Chúng dùng mô hình mạng nơ ron đa lớp truyền thẳng, liệu đầu vào (INPUT) 10, số biến lớp ẩn 8, tỉ lệ xác 99,2% Trong trình chạy không phát sinh lỗi Hình 4.15: Kết chi tiết theo ghi Hình 4.16 mô tả kết chi tiết độ xác số ghi sau lần sử dụng mạng nơ ron lần theo tỉ lệ phần trăm Với ghi có trường liệu mục tiêu ROIMANG có 99,0% ghi dự đoán (nghĩa dự đoán trường liệu mục tiêu 0), có 1,0% ghi dự đoán sai (nghĩa dự đoán trường liệu mục tiêu 1) 57 Hình 4.16: Kết chi tiết độ xác sử dụng mạng Nơ ron lần Với ghi có trường liệu mục tiêu ROIMANG có 0,6% ghi dự đoán sai (nghĩa dự đoán trường liệu mục tiêu 0), có 99,4% ghi dự đoán (nghĩa dự đoán trường liệu mục tiêu 1) Hình 4.17: Cấu hình mạng Nơ ron kết lần (để dự đoán) 58 Hình 4.17 mô tả cấu hình mạng nơ ron kết lần Chúng ta thấy số lượng biến đầu vào 10, số lượng node lớp ẩn 8, số lượng kết đầu trường mục tiêu ROIMANG Hình 4.18: Kết chi tiết theo ghi mạng nơ ron lần Sau lần phân lớp mạng nơ ron lần kết chi tiết số ghi trình bảy hình 4.18 Trong cột có tiêu đề $N-ROIMANG mang giá trị thuê bao liên quan đến ghi phân lớp rời mạng cột mang giá trị thuê bao liên quan đến ghi không rời mạng 4.3.6 Đánh giá mô hình Sau sử dụng hai lần mạng nơ ron (lần đầu để biên tập lần sau để phân lớp) cho tập liệu 150.000 thuê bao huấn luyện đạt kết khả quan mô hình dự đoán 90% tập liệu đầu vào Đây kết tốt dựa vào mô hình tiếp tục áp dụng cho liệu thực tế 4.3.7 Hoàn thành kết Sau thực xong bước cuối cùng, chúng tôiđã thực mô hình gồm hai lần sử dụng mạng nơ ron nối tiếp nhau, sơ đồ động tác thực với phần mềm SPSS hình 4.19 Sơ đồ mô tả tất bước thực với phần mềm SPSS, từ đưa liệu đầu vào vào phần mềm SPSS kết cuối Khi thực bước đặt tên bước để gợi nhớ mục đích bước kết thực 59 Hình 4.19: Hoàn thành kết 4.4 Kết huấn luyện với tập thuê bao đầu vào khứ Theo kết huấn luyện với 30% tập thuê bao đầu vào huấn luyện, có kết sau: Sử dụng mạng Nơ ron lần với mục đích biên tập liệu Khi sử dụng mạng nơ ron lần 1, thấy kết với tập liệu kiểm tra 90,97% Bảng 4.2: Kết huấn luyện mạng Nơ ron lần Partition Tập liệu huấn luyện Đúng Sai Tổng 95,250 9,677 104,927 Độ xác phân lớp 90.78% 9.22% Tập liệu kiểm tra 41,003 4,070 45,073 Độ xác phân lớp 90.97% 9.03% Sử dụng mạng Nơ ron lần với mục đích phân lớp Khi sử dụng mạng nơ ron lần kết với tập liệu kiểm tra lớn nhiều, 98.77%, kết tốt, nhiên chưa phải kết cuối hai trình Bảng 4.3: Kết huấn luyện mạng Nơ ron lần 60 Partition Tập liệu huấn luyện Đúng Sai Tổng 94,868 1,10 95,976 Độ xác phân lớp 98.85% 1.15% Tập liệu kiểm tra 40,603 505 41,108 Độ xác phân lớp 98.77% 1.23% 4.5 Kết kiểm thử với tập thuê bao Để thử nghiệm kết với tập liệu dầu vào, thử với tập liệu đầu vào 50.000 thuê bao Trong phần mềm SPSS để làm điều này, thay tập liệu đầu vào, bắt đầu dùng phương thức run biểu tượng mạng nơ ron lần để lấy kết đầu Khi chạy kết đầu ra, kết xuất kết đầu thành file liệu excel file text Tuy nhiên, khuôn khổ hiển thị hết kết nên đưa kết tổng hợp sau: Bảng 4.4: Kết kiểm thử mô hình phân lớp Partition Tập liệu huấn luyện Đúng 45,539 Sai Tổng 4,461 50,000 Độ xác phân lớp 91.08% 8.92% 4.6 Hướng nghiên cứu tương lai Luận văn giải toán làm để xây dựng mô hình dự đoán thuê bao rời mạng, nhiên giới hạn thời gian thực nên luận văn có giới hạn định Hướng nghiên cứu tương lai thực sau • Mở rộng liệu thuê bao Mobifone thêm nhiều trường thông tin hơn, nhằm phản ánh hành vi người tiêu dùng 61 • Từ toán nghiên cứu dự đoán thuê bao rời mạng hay không, mở rộng toán trả lời câu hỏi: rời mạng tầm thời gian • Bên cạnh sử dụng mạng mơ ron để dự đoán thuê bao rời mạng hay không, sâu nghiên cứu sử dụng kỹ thuật khai phá liệu khác Decision Tree, Naive Bayes so sánh kết với nhằm tìm cách tốt để giải toán thuê bao rời mạng • Từ toán dự đoán thuê bao rời mạng, mở rộng nghiên cứu toán phân lớp khách hàng dựa vào hành vi tiêu dùng (các thuộc tính) sau phân thuê bao vào lớp khác để có động thái kinh doanh cho khách hàng lớp • Thay sử dụng phần mềm SPSS, xây dựng hệ thống mạng nơ ron để giải toán 4.7 Kết luận chương Chương thực thực nghiệmmô hình dự đoán thuê bao rời mạng mạng nơ ron đa lớp truyền thẳng (phần mềm sử dụng SPSS IBM) Để thực vấn đề này, khảo sát sở liệu Mobifone, sau nghiên cứu trường thông tin liệu Mobifone có Trên sở trường thông tin đó, trích lọc, tổng hợp liệu thuê bao theo trường thông tin định sẵn, kết có 200.000 thuê bao để giải toán Chúng sử dụng công cụ mạng nơ ron phần mềm SPSS để huấn luyện 150.000 thuê bao đầu vào Sau sử dụng kết để dự đoán 50.000 thuê bao có rời mạng hay không Kết dự đoán 90% Đây kết tốt cho phép áp dụng kết đề tài thực tế 62 KẾT LUẬNVÀ KIẾN NGHỊ Việc khai phá liệu Data Mining xu hướng thời đại ngành Công nghệ thông tin Dựa vào liệu khứ đưa kết luận áp dụng cho việc kinh doanh tương lai Việc áp dụng kỹ thuật Data Mining để dự đoán thuê bao khách hàng rời mạng (không sử dụng dịch vụ) phổ biến ngành viễn thông Những năm qua, giới Việt Nam có nhiều đề tài nghiên cứu việc áp dụng Data Mining để dự đoán thuê bao mạng viễn thông rời mạng Trong nhiều đề tài áp dụng nhiều kỹ thuật Data Mining khác 63 Cây định (Decision Tree), Mạng Nơ ron (Neuron Network) để giải toán dự đoán thuê bao rời mạng Đề tài đóng góp phần vào việc áp dụng kỹ thuật Data Mining để giải toán phân lớp, cụ thể dự đoán thuê bao rời mạng dựa vào mạng nơ ron Dựa vào khứ thông tin thuê bao Mobifone, khảosát nhiều thuộc tính thuê bao Mobifone loại thuê bao, thói quen gọi, thói quen nhắn tin, thói quen truy cập liệu data, thói quen mở máy, thói quen nạp tiền Từ thói quen ảnh hưởng đến việc thuê bao rời mạng hay không? Sau sử dụng mạng nơ ron để xây dựng mô hình dự đoán thuê bao rời mạng, mô hình đáp ứng 90% liệu khứ Chúng dùng kết để biên tập liệu thuê bao Và sử dụng mô hình mạng nơ ron để dự đoán thuê bao rời mạng dựa toàn liệu biên tập Kết thực nghiệm cho thấy mô hình đề xuất dự đoán 99% thuê bao rời mạng Vì tính xác việc dự đoán cao, nên kiến nghị ứng dụng phân tích vào việc dự đoán thuê bao rời mạng công ty viễn thông Đồng thời kỹ thuật áp dụng với ngành nghề khác Bài toán dự đoán thuê bao rời mạng phá triển thành toán dựa đoán thời điểm thuê bao rời mạng, toán phân lớp khách hàng, toán dự đoán doanh thu DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Phạm Thị Hoàng Nhung (2006), Luận văn thạc sỹ, Đại học Quốc gia Hà Nội Tiếng Anh: [2] Berson, A.S., & Threaling, K (2000), Buiding data mining applications for CRM, McGraw-Hill, New York, NY [3] Hung, S.Y., Yen, D.C., Wang, H.Y (2006), “Applying data mining to telecom churn management”, Expert Systems with Applications, Vol 3.1, pp 515-524 64 [4] Sharma, A., Panigrahi, P.K (2011), “A Neural Network based Approach for Predicting Customer Churn in Cellular Network Services”, International Journal of Computer Applications, Vol 27, No 11, pp 26-31 [5] Adwan, O., Faris, H., Jaradat, K., Harfoushi, O., Ghatasheh, N (2014), “Predicting Customer Churn in Telecom Industry using Multilayer Preceptron Neural Networks Modeling and Analysis”,Life Science Journal, Vol 11, No 3, pp 75-81 [6] Han, J Kamber, M Jian, J (2012), Data Mining Concepts and Techniques, Elseviel [7] Whitley, D., Starkweather, T., Bogart, C (1990), Genetic algorithms and neural networks: optimizing connections and connectivity, in: Parallel Computing 14, 347-361, North-Holland [8] Montana, D and Davis, L (1989), Training feedforward neural networks using genetic algorithms, In Proceedings of the Eleventh International Joint Conference on Artificial Intelligence, 762-767, Morgan Kaufmann, Illingworth, W.T San Mateo, (1991), A CA [9] Practical Nelson, Guide M.C to and Neural Nets, Reading, MA: Addison-Wesley [10] Narasimhy, M.N, Susheela, V.S (2011), Pattern Recognition An Algorithmic Approach, Springer, USA [11] IBM (2011), IBM SPSS Modeler 14.2 In-Database Mining Guide, IBM [12] Tsai, C.F., Lu, Y.H (2009), “Customer churn prediction by hybrid neural networks”,Expert Systems with Applications 36 (2011),No 12547– 12553, pp 5-7 [13] H.Jeff (2008), Introduction to Neural Networks for C#, Second Edition, Heaton Research Inc 65 [14] Wendler, T., Grottrup, S., “Data Mining with SPSS Modeler: Theory, Exercises and Solutions”, Springer, 2016 [15] Blum, A L., Langley, P., Selection of Relevant Features and Examples in Machine Learning, Artificial Intelligence, Vol 97, pp 245-271, 1997 [...]... mạng Nơ ron 32 Đầu vào: dữ liệu thuê bao rời mạng của vông ty Mobifone Đầu ra: mô hình dự đoán thuê bao nào rời mạng 2.5 Mô hình xây dựng hệ thống dự đoán thuê bao rời mạng Sau khi nghiên cứu lý thuyết khai phá dữ liệu và mạng nơ ron, chúng tôi sẽ sử dụng các lý thuyết về Khai phá dữ liệu và mạng nơ ron đa lớp truyền thẳng để giải bài toán xây dựng hệ thống dự đoán thuê bao rời mạng Mô hình xây dựng hệ. .. và mạng nơ ron để dự đoán thuê bao rời mạng dựa vào một tập thuê bao đã rời mạng cho trước Kỹ thuật này phù hợp với yêu cầu của đề tài, đó là dự đoán một thuê bao rời mạng hay không, như vậy đầu ra có hai kết quả CHƯƠNG 3 –KHẢO SÁT DỮ LIỆU THUÊ BAO CỦA MOBIFONE 3.1Mục tiêu chương Chương nàysẽ khảo sát dữ liệu thuê bao của MobiFone để chuẩn bị dữ liệu đầu vào cho việc xây dựng mô hình dự đoán thuê bao. .. dự đoán các thuê bao rời mạng cũng là một công việc quan trọng Để dự đoán được thuê bao rời mạng thì dựa vào tập thuê bao rời mạng đã có từ trước và các thuộc tính của nó để tìm ra quy luật rời mạng, sau đó áp dụng quy luật đó cho tập thuê bao mới để ra kết quả Đề tài này nghiên cứu cơ sở lý thuyết, đề ra mô hình và hiện thực để giải bài toán dự đoán thuê bao rời mạng của công ty MobiFone dựa vào mạng. .. vào công cụ mạng nơ ron của phần mềm SPSS Phần mềm SPSS có công cụ mạng nơ ron hỗ trợ tạo một mô hình dự đoán Chúng tôi lựa chọn các thông số mạng nơ ron sau đó đưa file đầu vào là dữ liệu huấn luyện đã được xử lý sau bước thứ 2 để bắt đầu tạo mô hình Đầu ra sẽ là một mạng nơ ron với các hệ số được phần mềm tính toán sẵn Việc xác định các hệ số của mạng nơ ron dựa trên thuật toán mạng nơ ron đa lớp... đường mòn nơ ron, các con đường này tạo nên hệ thống giao tiếp của bộ não [7] Nơ ron nhân tạo Một nơ ronlà một đơn vị xử lý thông tin và là thành phần cơ bản của một mạng nơ ron Cấu trúc của một nơ ron ược mô tả trên hình 2.3 Inputs X1 Weights W1 Output X2 W2 Wx Xx Hình 2.3:Mô hình mạng Nơ ron nhân tạo Các thành phần cơ bản của một nơ ronnhân tạo bao gồm: 18  Tập các đầu vào: Là các tín hiệu vào (input... ” là đầu vào của n ron j,δi là tín hiệu học Từ các phân tích trên, thuật toán lan truyền ngược sai số được xây dựng như sau: Xét một mạng nơ- ron truyền thẳng có Q lớp, q = 1, 2, …, Q, và gọi neti và yi là tín hiệu vào và ra của nơ- ron thứ i trong lớp q Mạng này có m đầu vào và n đầu 27 ra Đặt qwij là trọng số của liên kết từ nơ- ron thứ j trong lớp q-1 tới nơ- ron thứ i trong lớp q Đầu vào: Một tập các... hình dự đoán thuê bao rời mạng của Mobifone dựa vào 35 phần mềm SPSS.Việc khảo sát dữ liệu của Mobifone sẽ bao gồm tìm hiểu mô hình tổ chức dữ liệu, các loại dữ liệu, và các cách tổng hợp dữ liệu 3.2Khảo sát dữ liệu thuê bao của MobiFone 3.2.1 Tổng quan về hệ thống dữ liệu thuê bao của MobiFone Hiện nay, công ty Mobifone là công ty kinh doanh dịch vụ thông tin di động, nhiệm vụ chính của công ty là cung... giữa các nơ ron 19 2.2.1.3 Các kiểu mô hình mạng nơ ron Tự kết hợp (autoassociative): là mạng có các neural đầu vào cũng là các nơ ron ầu ra Mạng Hopfield là một kiểu mạng tự kết hợp Hình 2.1 dưới đây là mô hình của mạng tự kết hợp Output Inputs Hình 2.4: Mô hìnhmạng tự kết hợp Kết hợp khác kiểu (heteroassociative): là mạng có tập nơ ron ầu vào và đầu ra riêng biệt Perceptron, các mạng Perceptron nhiều... truyềnthẳng 21 Nơ ron vào Nơ ron ẩn Nơ ron ra Hình 2.7: Mô hìnhmạng phảnhồi Kiến trúc phản hồi (Feedback architecture): là kiểu kiến trúc mạng có các kết nối từ nơ ron đầu ra tới neural đầu vào Mạng lưu lại các trạng thái trước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào mà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộc loại này Hình 2.7 là mô tả của mạng. .. nhiệm vụ của mạng là phân loại các mẫu này vào một trong 10 lớp tương ứng với 10 chữ số 0, 1, …, 9 Khi đó p là kích thước mẫu và bằng 8 x 2= 16; q là số lớp và bằng 10  Mỗi nơ ron thuộc tầng sau liên kết với tất cả các nơ ron thuộc tầng liền trước nó  Đầu ra của nơ ron tầng trước là đầu vào của nơ ron thuộc tầng liền sau nó Hoạt động của mạng MLP như sau: tại tầng đầu vào các nơ ron nhận tín hiệu vào ... thực hệ thống dự đoán thuê bao (khách hàng) rời mạng (rời bỏ dịch vụ) mà công ty cung cấp Xuất phát từ việc đó, mạnh dạn nghiên cứu đề tài Xây dựng hệ thống dự đoán thuê bao rời mạng MobiFone dựa. .. việc dự đoán thuê bao rời mạng công việc quan trọng Để dự đoán thuê bao rời mạng dựa vào tập thuê bao rời mạng có từ trước thuộc tính để tìm quy luật rời mạng, sau áp dụng quy luật cho tập thuê bao. .. CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - TRẦN THANH GIẢNG LỜI CAM ĐOAN XÂY DỰNG HỆ THỐNG DỰ ĐOÁN THUÊ BAO RỜI MẠNG CỦA MOBIFONE Tôi cam đoan công trình nghiên cứu riêng DỰA VÀO MẠNG NƠ RON

Ngày đăng: 17/12/2016, 23:43

Từ khóa liên quan

Mục lục

  • LỜI CAM ĐOAN

  • LỜI CẢM ƠN

  • MỤC LỤC

  • DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

  • DANH SÁCH HÌNH VẼ

  • DANH SÁCHBẢNG

  • MỞ ĐẦU

  • CHƯƠNG 1 - TỔNG QUAN

  • 1.1 Tổng quan vấn đề cần nghiên cứu

  • 1.2 Lý do chọn đề tài

  • 1.3 Những kết quả đạt được của luận văn

  • CHƯƠNG 2 -CƠ SỞ LÝ LUẬN

  • 2.1 Giới thiệu về khai phá dữ liệu (Data Mining)

    • 2.1.1 Khai phá dữ liệu là gì?

    • Hình 2.1: Các bước trong Data Mining & KDD ([6])

      • 2.1.2 Mô hình khai phá dữ liệu

      • Hình 2.2: Mô hình khai phá dữ liệu

        • 2.1.3 Các kỹ thuật khai phá dữ liệu

        • 2.1.3.1 Phân lớp

        • 2.1.3.2 Phân cụm

        • 2.1.3.3 Luật kết hợp

        • 2.1.3.4 Mẫu tuần tự

        • 2.1.3.5 Hồi quy

Tài liệu cùng người dùng

Tài liệu liên quan