Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn

29 495 0
Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đại Học Quốc Gia TP.HCM Trường Đại Học Công Nghệ Thông Tin BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN ĐỀ TÀI: GVHD: Người thực hiện: Lớp: TP.HCM – 6/2012 GS.TSKH Hoàng Văn Kiếm Lê Xuân Nguyên Nguyễn Thị Phương Trang CNTT K6 Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm MỤC LỤC Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -2- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm LỜI MỞ ĐẦU  Trong thời đại hiện việc khai thác dữ liệu và sử dụng chúng là một vấn đề quan tâm hàng đầu của mọi lĩnh vực Dữ liệu được khai thác có thể là từ nhiều nguồn: có cấu trúc và phi cấu trúc Một những nguồn dữ liệu được quan tâm và nó quyết định nhiều đến sự thành bại của một doanh nghiệp là dữ liệu đến từ website Hàng ngày dữ liệu về khách truy cập của một website rất lớn và nó trở thành một nguồn tài nguyên quý báu cho doanh nghiệp Trong bài thu hoạch này chúng xin trình bày việc khai phá dữ liệu từ website trường đại học Hùng Vương Tp HCM thông qua một ứng dụng nổi tiếng của google là Google Analytics Website các trường đại học hiện được cải thiện rất nhiều về hình thức lẫn nội dung đăng tải bởi nó là bộ mặt của một trường đại học, một các tiêu chí đánh giá một trường đại học có tín và chất lượng hay không cũng phụ thuộc vào website trường đó Tuy nhiên, từ hàng triệu người truy cập vào các website đó họ có hài lòng nội dung hay không, thông tin nào họ quan tâm website, người khơng hài lòng về website đó… Hay nội dung trang web họ thấy thích thú nhất, người sẽ quay trở lại website họ truy câp? …Tất cả những điều đó chúng ta phải phân tích từ nguồn dữ liệu truy cập của người dùng Từ những báo cáo đó chúng ta mới có thể cải thiện được website cho trường đại học, góp phần vào công tác quản lý đào tạo và tuyển sinh của trường Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -3- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm I Tổng quan Data mining Giới thiệu: Trong thời điểm Công nghệ thông tin phát triển mạnh mẽ nay, với mật độ sử dụng dày đặt ứng dụng CNTT vào tất ngành nghề đời sống, dẫn đến lượng thông tin cần để lưu trữ tăng đột biến Vậy vấn đề đặt sau: làm để người sử dụng sử dụng hiệu nguồn liệu mà lưu trữ, làm để khai thác liệu có ích từ khối liệu khổng lồ có sẵn… Nhìn vào cách thức hoạt động số ứng dụng như: chương trình tìm kiếm Google, mạng chia sẻ Facebook, hay website buôn bán trực tuyến Amazon.com người sử dụng nhận thấy sau: • Google ln trả cho người sử dụng kết tìm kiếm tốt nhất, thơng minh có độ xác cao nhiều người sử dụng đăng nhập tìm kiếm tài khoản Google, so với tìm kiếm khơng sử dụng tài khoản Google • Khi sử dụng Facebook người sử dụng thường thắc mắc tính suggestions friends Bởi tài khoản chức giới thiệu đa số người mà họ quen biết Vậy Facebook lại thông minh đến mức vậy? • Amazon.com website bán hàng trực tuyến lớn internet, người sử dụng để ý người sử dụng xem thơng tin chi tiết hàng nào, ví dụ mặt hàng sách, họ xem sách website kèm theo danh sách sách gợi ý mua kèm theo người sử dụng xem, thống kê cho thấy có tới 70% đầu sách người dùng mua thêm thơng qua hình thức gợi ý Vậy điều làm cho việc bán sách hiệu đến vậy? Tất cả các vấn đề đều có một hướng giải quyết liên quan đến Data mining Data mining định nghĩa q trình chắt lọc, trích xuất thơng tin có mối quan hệ có mối tương quan định từ kho liệu lớn (cực lớn) nhằm mục đích dự đốn xu thế, hành vi tương lai, tìm kiếm tập thơng tin hữu ích mà bình thường khơng thể nhận diện Một ví dụ hay sử dụng việc khai thác vàng từ đá cát, Data mining ví cơng việc "Đãi cát tìm vàng" trongmột tập hợp lớn liệu cho trước Thuật ngữ Data mining ám việc tìm kiếm tập hợp nhỏ có giá trị từ số lượng lớn liệu thô Ứng dụng Data mining Ứng dụng Data mining đa dạng: • Phân tích liệu hỗ trợ định o Phân tích quản lý thị trường Quảng cáo cá nhân (target marketing), quản lý quan hệ kháchhàng (CRM), phân tích giỏ hàng, bán hàng liên quan (crossselling), phân chia thị trường o Phân tích quản lý rủi ro Dự đoán, giữ khách hàng, phân tích cạnh tranh Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -4- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm o Phát gian lận phát mẫu bất thường • Các ứng dụng khác o Khai phá văn (nhóm tin – email, tài liệu…) o Khai phá Web o Khai phá liệu luồng (chuỗi) Các công cụ, kỹ thuật Data mining trả lời câu hỏi mà cơng cụ truyền thống địi hỏi nhiều thời gian cần thiết để giải đáp Nó tìm thấy thơng tin hữu ích mà dễ bị bỏ qua không xem xét đến để dự đốn xu thế, hành động xảy tương lai Để Data mining cách hiệu quả, điều cần phải thu thập liệu định nghĩa lại theo tiêu chí cần phân tích Các kỹ thuật Data mining cài đặt nhanh chóng tảng phần mềm, phần cứng phổ thông mà không cần đòi hỏi phức tạp, Data mining thường gắn liền với việc phân tích khối lượng liệu cực lớn nên cần ứng dụng công nghệ high performance client/server xử lý song song (parallel programming) Data mining ứng dụng toán yêu cầu cần có chức năng, nghiệp vụ như: • Tự động hóa việc dự đốn xu hành vi diễn tương lai: Data mining tự động hóa q trình tìm kiếm trích xuất tập thơng tin có mối quan hệ tương quan tập liệu cực lớn Một ví dụ đơn giản: Facebook lại gợi ý cho người sử dụng toàn người mà họ quen biết? Facebook dựa vào thông tin mà người sử dụng lưu trữ như: mối quan hệ, công ty làm, trường học…Facebook mơ hình hóa tham số có độ liên quan định để đưa gợi ý mà có xác xuất cao Tất điều Facebook làm trình thu thập liệu hoạt động người dùng site, sau sử dụng công nghệ data mining để cung cấp nội dung, tính phù hợp cho người dùng • Tự động hóa việc khám phá, nhận diện tập thông tin khứ mà hệ thống chưa biết: Cơng cụ Data mining q trình phân tích liệu nhận diện những tập thông tin, liệu khơng có bị ẩn mối liên hệ mà xác định trước Ví dụ việc bán hàng, có sản phẩm khơng có mối liên hệ với nhau, lại hay bán nhau, từ đưa chế recommendation (tự động giới thiệu sản phẩm đến khách hàng) Cụ thể, Amazon lại đưa danh sách sách bán kèm có tỷ lệ bán cao vậy? Để làm điều Amazon đầu tư phát triển hệ thống recommendation hàng chục năm, thời gian dài khơng phát triển túy cơng nghệ mà cịn qng thời gian thu thập phân tích hành vi người sử dụng site Amazon, thời gian dài, liệu thu thập lớn, dẫn đến tập thơng tin có độ tương quan nhiều xác Ví dụ: bạn đăng nhập vào website, hệ thống lưu lại nội dung tìm kiếm bạn, bạn xem sách A bất kỳ, hệ thống tự động giới thiệu sách B Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -5- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm mà tỷ lệ mua A cao sách có nội dung gần giống A phù hợp với nội dung tìm kiếm mà hệ thống lưu bạn Và trình Data mining Ngày nay, công nghệ data mining ứng dụng rộng rãi công ty lấy khách hàng làm trung tâm truyền thơng, tài chính, marketing, bán hàng, nghành cơng nghiệp sản xuất … Nó cho phép cơng ty xác định mối quan hệ yếu tố nội giá thành, mẫu mã, cách thức quảng cáo, chí kỹ nhân viên cơng ty… yếu tố bên ngồi đối thủ cạnh tranh, sách kinh tế hay nhu cầu thị trường … Và cịn hỗ trợ việc xác định tác động sách khuyến mãi, giảm giá, độ hài lòng khách hàng lợi nhuận doanh nghiệp… Các bước Data mining Data mining bao gồm bước sau: a Thu thập, chuẩn hóa liệu nhập liệu vào hệ thống kho liệu (Datawarehouse) b Đưa chế truy xuất cho ứng dụng phân tích liệu c Sử dụng phần mềm phân tích để tính tốn d Kết xuất liệu dạng dễ hiểu, biểu đồ dạng report Các hướng data mining Data mining chia thành hướng như: 1) Mơ tả khái niệm (concept description): thiên mơ tả, tổng hợp tóm tắt khái niệm Ví dụ: tóm tắt văn 2) Luật kết hợp (association rules): dạng luật biểu diễn tri thứ dạng đơn giản Ví dụ: “60 % phụ nữ vào siêu thị mua kem dưỡng da có tới 80% số họ mua thêm sữa rửa mặt” Luật kết hợp ứng dụng nhiều lĩnh vực kinh doanh, y học, tin-sinh, tài & thị trường chứng khoán … 3) Phân lớp dự đoán (classification & prediction): xếp đối tượng vào lớp biết trước Ví dụ: phân lớp người truy cập theo quốc gia, tỉnh thành… Hướng tiếp cận thường sử dụng số kỹ thuật machine learning định, mạng nơ ron nhân tạo 4) Phân cụm (clustering): xếp đối tượng theo cụm (số lượng tên cụm chưa biết trước) 5) Khai phá chuỗi (sequential/temporal patterns): tương tự khai phá luật kết hợp có thêm tính thứ tự tính thời gian Hướng tiếp cận ứng dụng nhiều lĩnh vực tài thị trường chứng khốn có tính dự báo cao Một số cơng nghệ thường áp dụng data mining: • Mạng trí tuệ nhân tạo (Artificial neural networks): Đây mơ hình mà hệ thống tự học thơng qua đào tạo với tập liệu ban đầu, từ suy đốn tập kết từ tập liệu mà khai thác Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -6- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm • Cây định (Decisions Trees): Học định phương pháp sử dụng rộng rãi cho việc học quy nạp từ mẫu lớn Đây phương pháp xấp xỉ hàm mục tiêu có giá trị rời rạc Mặt khác, định cịn chuyển sang dạng biểu diễn tương đương dạng tri thức luật If-then Thuộc tính tốt thuộc tính có độ lấy thơng tin lớn Phương pháp học máy dùng định dựa định hiệu làm việc với số lượng lớn thuộc tính, từ định rút hệ thống luật học • Giải thuật di truyền (Generic Algorithms): Kỹ thuật sử dụng trình phối hợp, biến đổi, chọn lọc tự nhiên kế thừa từ khái niệm tiến hóa • Phương pháp Người láng giềng gần (Nearest neighbor method): Đây kỹ thuật phân loại ghi/thông tin tập liệu dựa kết hợp k records có độ giống tập liệu khứ • Nguyên tắc suy diễn (Rule induction): Kỹ thuật bóc tách liệu dựa nguyên tắc Nếu-Thì từ tập liệu thống kê Khai phá liệu Web (Khai phá web ứng dụng Data mining Trong phạm vi đề tài này, chúng tơi xin trình bày liệu web, q trình khai phá liệu web) Với phát triển ngày lớn mạnh phổ biến mạng Internet, người dần làm quen sử dụng Internet nhu cầu thiết yếu sống Với Internet người làm quen với trang Web với thông tin hay nhu cầu khác Intrnet trở thành kênh khoa học, thông tin kinh tế, thương mại quảng cáo Có thể nói trang Web từ điển Bách khoa tồn thư Thơng tin trang Web đa dạng mặt nội dung hình thức Có thể nói Internet xã hội ảo, bao gồm thơng tin mặt đời sống kinh tế, xã hội trình bày dạng văn bản, hình ảnh, âm Sự phát triển nhanh chóng mạng Internet sinh khối lượng khổng lồ liệu dạng siêu văn (dữ liệu Web) Có thể nói nhu cầu tìm kiếm thơng tin mơt sở liệu phi cấu trúc phát triển chủ yếu với phát triển Internet Tuy nhiên với đa dạng số lượng lớn thông tin nảy sinh vấn đề tải thông tin Người ta khơng thể tìm tự kiếm địa trang Web chứa thơng tin mà cần, người chủ trang web biết xác mục đích thể trang web đến với người xem chưa Ví dụ, giả sử có trang Web vấn đề tuyển sinh, tin tức… Căn vào nội dung tài liệu mà khách hàng xem download về, sau phân lớp biết khách hàng hay tập trung vào nội dung trang Web chúng ta, từ bổ sung thêm nhiều tài liệu nội dung mà khách hàng quan tâm ngược lại Cịn phía khách hàng sau phân tích biết khách hàng hay tập trung vấn đề gì, để từ đưa Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -7- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm hỗ trợ thêm cho khách hàng Từ nhu cầu thực tế trên, phân lớp tìm kiếm trang Web tốn hay cần phát triển nghiên cứu Khác với khai phá liệu sở liệu bình thường, dạng sở liệu siêu văn bản, ta cần ý: • Cơ sở liệu web có kích thước lớn, khơng lưu trữ nơi, lưu trữ phân tán nhiều máy tính khắp nơi giới Như việc xây dựng kho liệu (datawarehouse) để lưu trữ, chép hay tích hợp liệu Web khó khăn, gần khơng thể • Độ phức tạp trang Web lớn nhiều so với tài liệu văn truyền thống khác Các liệu CSDL truyền thống thường loại liệu đồng (về ngơn ngữ, định dạng,…), cịn liệu Web hồn tồn khơng đồng Ví dụ ngơn ngữ liệu Web bao gồm nhiều loại ngôn ngữ khác (Cả ngôn ngữ diễn tả nội dung lẫn ngôn ngữ lập trình), nhiều loại định dạng khác (Text, HTML, PDF, hình ảnh âm thanh,…), nhiều loại từ vựng khác (Địa Email, liên kết (links), mã nén (zipcode), số điện thoại)… Điều thử thách lớn cho việc tìm kiếm phân loại thông tin cần thiết Khai phá liệu Web tập trung vào thành phần có trang Web Đó là: Khai phá nội dung trang Web (Web Content mining) Khai phá nội dung trang Web gồm hai phần: a Web Page Content Nghĩa sử dụng từ văn mà không tính đến liên kết văn b.Search Result Tìm kiếm theo kết Trong máy tìm kiếm, sau tìm trang Web thoả mãn u cầu người dùng, cịn cơng việc khơng phần quan trọng, phải xếp kết theo thứ tự dộ gần với nội dung cần tìm kiếm Web Structure Mining Khai phá dựa siêu liên kết văn có liên quan Web Usage Mining Phân tích Web log để khám phá mẫu truy cập người dùng trang Web Phân tích mẫu truy cập người dùng thời điểm để biết xu hướng truy cập trang Web đối tượng người dùng thời điểm khác Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -8- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm II Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giới thiệu Google Analytics Google Analytics công cụ hoạt động web sử dụng hồn tồn miễn phí Google Google Analytics giải pháp phân tích trang web mạnh mẽ thị trường công cụ nhà quản trị website người làm SEO ưa chuộng Nhờ Google Analytics , thu thập thơng tin, theo dõi, thống kê, đo lường, phân tích, xử lý liệu website chiến dịch quảng cáo Hình : Giao diện tổng quan Google Analytics Cách thức động Google Analytics Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 hoạt -9- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm Hình : Cách thức hoạt động Google Analytics Đối với Google Analytics người sử dụng có thể: Biết lượng người truy cập vào website hàng ngày bao nhiêu, họ đến website từ đâu (qua tìm kiếm Google, qua click vào link từ website khác, hay gõ trực tiếp tên website ….) Nếu tìm kiếm Google người sử dụng biết họ tìm kiếm từ khóa nào, từ người quản trị dễ dàng đưa chiến lược định hướng nội dung tốt để thu lượng truy cập nhiều trung thành Google Analytics tạo lên đến 85 báo cáo khác giúp người sử dụng phân tích tất liệu lưu lượng truy cập trang web họ, nguồn truy cập, hành vi người ghé thăm hiệu chiến dịch quảng cáo, số lượng người xem rời khỏi website, họ ngừng ngừng xem website trang nào… Google Analytics không theo dõi khách truy cập vào trang web người sử dụng số lần xem trang, sử dụng để xem nội dung ghé thăm nhiều nhất, thời gian trang web cho truy cập, theo dõi trình diễn chiến dịch tiếp thị, bao gồm AdWords, Adsense – quảng cáo trực tuyến google, email nhiều thứ khác Từ điều chỉnh chiến dịch quảng cáo chiến dịch marketing cách hiệu Ứng dụng google analytics vào trang web Đại học Hùng Vương TP.HCM Nhu cầu Trường ĐH Hùng Vương Tp HCM: Cần báo cáo thông tin sau: • Số lượng người truy cập vào website tháng, học kỳ • Nội dung người truy cập quan tâm gì? • Những nội dung website không người truy cập quan tâm? • Những tỉnh thành có số lượng truy cập đến website nhiều (mục đích để có hình thức giới thiệu tuyển sinh Trường khu vực đó) Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -10- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm Dựa vào số này, người quản trị đưa chiến lược đắn để tối ưu nội dung website dành cho máy tìm kiếm, từ thu hút thêm khách thăm quan Hình : Traffic Sources Dựa vào hình ta thấy, lượng khách truy cập vào đại học Hùng Vương Tp HCM chủ yếu là thông qua search engine, nhiên nhìn vào từ khóa của những người truy cập vào từ nguồn này chúng ta nhìn thấy các từ khóa này hoàn toàn mang tính chất là người truy cập chủ động tìm kiếm website đại học Hùng Vương Tp HCM, không có một từ khóa nào thể hiện truy cập từ một từ khóa khác, điều này chứng tỏ nguồn tài nguyên và tối ưu hóa bộ máy tìm kiếm website đại học Hùng Vương Tp HCm rất yếu, điều này ảnh hưởng lớn đến công tác tuyển sinh và truyền bá hình ảnh của trường đại học Hùng Vương TP.HCM Content Sau tất báo cáo vấn đề "đối ngoại" phần Content chủ yếu liên quan tới vấn đề "đối nội" Các báo cáo phần tập trung vào nội dung thông tin website chúng ta, phần khách ghé thăm nhiều nhất, phần làm ngắt luồng thông tin khách Sâu nữa, số báo cáo thuộc phần cho chúng ta biết lượng khách thăm quan website quan tâm tới vấn đề dựa từ khóa tìm kiếm họ sử dụng, sau tìm thấy thơng tin họ đọc trang, lâu số thông tin tìm được, từ chúng ta đánh giá mức độ hữu ích thơng tin Một diểm đáng ý trang thông tin trở thành exit page (trang cuối khách xem trước rời website - BTV) nhiều chúng ta nên xem lại Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -15- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm xem trang liệu có chứa link tới nơi khác bổ ích hay khơng, nội dung trang đề cập tới vấn đề gây phản cảm Hình : Content Goals Đây phần dùng nhất, lại phần quan trọng số người Ở phần này, chúng ta tạo lập số trang "mục tiêu", Google Analytics cho chúng ta biết người, làm cách nào, thông qua trang khác người dùng tới trang "mục tiêu" Ví dụ trường hợp site thương mại điện tử, trang mục tiêu thiết lập trang hiển thị hóa đơn sau mua hàng Chúng ta dựa vào báo cáo để biết người mua hàng chúng ta quan tâm tới trước mua hàng, từ tùy biến nội dung phần thơng tin để thu hút thêm nhiều khách mua hàng, khách dừng lại trang quy định vận chuyển hàng hóa chẳng hạn, chắn chúng ta có vấn đề với phương thức vận chuyển Chúng ta dựa vào báo cáo phần Goals để tính tốn phần trăm khách thăm quan đạt tới trang mục tiêu tổng số người ghé thăm website, từ tính tốn số gần tỉ lệ thành công khách hàng tiềm chúng ta có thơng qua website Ứng dụng website Trường Đh Hùng Vương Tp HCM, trang mục tiêu thiết lập trang giới thiệu ngành đào tạo Trường Dựa vào báo cáo này, Trường đưa tỉ lệ tuyển sinh cho ngành, thay đổi nội dung để người truy cập quan tâm Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -16- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm Tóm lại: Thông qua việc phân tích dữ liệu sử dụng Google Analytics vào website đại học Hùng Vương TP.HCM chúng ta mới nhìn nhận được hết vấn đề mà website mang phải, lượng truy cập hầu chỉ ở nội bộ trường, phân bố không đồng đều, không được lan truyền mạnh mẽ internet Những điều đó gây khó khăn lớn việc tuyên truyền, quảng bá đại học Hùng Vương TP.HCM mạng internet, Trường Đại học Hùng Vương TP.HCM cần phải cải thiện website về cả nội dung và hình thức nữa mới mong là một kênh tuyển sinh và quảng bá trường Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -17- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm PHỤ LỤC CÁC THUẬT NGŨ SỬ DỤNG TRONG GOOGLE ANALYTICS Visits : visits lượt truy cập Một người vào website tính lượt truy cập tính nhiều lượt truy cập Cụ thể : lượt truy cập tính hay nhiều lần bạn vào website khoảng thời gian 30 phút Ví dụ thời điểm lúc 8h tối , bạn truy cập vào website hungvuong.edu.vn tính lượt truy cập Bạn xem website, chẳng hạn vừa mở lại tắt ln, sau mở lại lại tắt ln….Có thể bạn vào đọc nhiều trang nội dung khác , thời gian bạn website chưa 30 phút tính lượt truy cập Lúc 8h31 phút, bạn lại vào hungvuong.edu.vn, bạn xem website, lại tính lượt truy cập Một lưu ý mạng nội (LAN), nhiều máy có địa IP duyệt web tính khách truy cập (unique visitor) nhiều lượt truy cập (visit) Các số liệu lưu lượng truy cập thường xem người quản trị thông qua thống kế (statistics) cài đặt lên máy chủ web Có nhiều thống kê từ miễn phí đến thương mại với nhiều tính thống kê chuyên nghiệp loại/phiên trình duyệt web hệ điều hành khách truy cập, họ đến từ đâu, tìm kiếm web qua từ khóa với cơng cụ tìm kiếm gì…Đây thông số quan trọng giúp người quản trị hiệu chỉnh web, lập chiến lược marketing… Pageviews : Số trang xem Một website thông thường có nhiều trang Mỗi trang được load thông qua địa URL Mỗi lần bạn F5 trang web hay truy cập URL tính pageview Nói cách khác pageview = lần request trang web server từ trình duyệt người dùng, trang truy cập Visitors: Từ viết dài “Unique Visitors” hay “Absolute Unique Visitors” theo Google, có ý nghĩa Số lượng người dùng truy cập site Người dùng tính dựa Cookies trình duyệt IP bạn Ví dụ sử dụng Google Analytics bạn chọn khoảng thời gian báo cáo (report date range) tháng số visitors phản ánh số lượng người truy cập không trùng lặp tháng Nếu tháng chọn để báo cáo, bạn truy cập website lần Google tính bạn visitor khoảng thời gian Một Unique Visitor khởi tính dựa yếu tố mốc thời gian mà người dùng bắt đầu truy cập trang web + số ID ngẫu nhiên máy tính bạn Thực số phản ảnh tương đối, thực tế khơng biết khoảng thời gian người dùng khơng xóa Cookies trình duyệt hay thay đổi IP Ví dụ với máy tính quán Internet, bạn vừa đọc báo hungvuong.edu.vn xong, bạn trả tiền máy tính bạn vừa xử dụng vừa logoff, lát sau có người khác vào đọc báo hungvuong.edu.vn, rõ ràng người khác thống kê Google Analytics người Unique Page Views: Trước tìm hiểu số này, bạn cần biết thêm thuật ngữ Google Session Theo định nghĩa chuẩn Google session Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -18- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm tương đương 30 phút hoạt động site người dùng với điều kiện khơng có truy cập sang domain khác chen người dùng click vào đường link dẫn sang trang web khác site (Outbound link) Nói cách dễ hiểu hơn, truy cập website ABC.com, bạn duyệt liên tiếp trang A > B > C Sau trang C, bạn click vào link dẫn đến trang web XYZ.com Ngay lúc session kết thúc bạn truy cập trang ngồi (domain khác) Sau đó, bạn trở lại trang ABC.com để tiếp tục duyệt trang khác, lúc session thứ khởi tính bạn thuộc lượt truy cập thứ ( tính lượt truy cập tất thao tác bạn nằm phạm vi 30 phút tính từ lúc bạn bắt đầu truy cập ABC.com) Người ta thường xem visit session gần giống nhau, xét cho kĩ lưỡng số lượng session nhiều visit lượt truy cập Average PageViews: Tức số trang xem trung bình lượt truy cập Tỷ lệ phản ánh hấp dẫn Site người đọc, Average PageViews lớn chứng tỏ chất lượng nội dung Website cao Ngoài ra, số cho thấy việc người đọc tìm thấy nhiều thơng tin hữu ích liên quan đến thứ họ cần Nếu website bạn có chất lượng theo thời gian số tăng lên bạn đạt số lượng bạn đọc trung thành lượng người đăng kí theo dõi Website (Subscriber) định Ngược lại, số thấp, bạn nên xem lại nội dung website bạn giao diện website nên đặt thêm phần Related Post để người đọc tìm thấy thơng tin hay viết khác liên quan Time on Site: Thời gian mà khách truy cập bỏ để đọc website bạn Trung bình, người dành khoảng 20 – 30 giây đọc lướt qua để tìm thứ họ cần sau bỏ khơng thấy Nếu bạn cung cấp cho họ mà khách truy cập tìm giờ, họ dừng lại đọc tiếp nội dung trang web bạn Tỉ lệ Time on Site thấp (dưới 10 giây trang) có nghĩa khách truy cập click click, họ không đọc nội dung website Bounce Rate: Bounce rate lượng khách truy cập vào website xem trang Sự kiện xảy người truy nhập trang site họ nhấn chuột rời bỏ Web site, khơng quay trở lại 30 phút tính từ lúc vào website Tỉ lệ bỏ Web cao nhiều yếu tố có yếu tố thời gian tải Web chậm, nội dung không phù hợp với người truy cập, thiết kế giao diện không hút … Những bí để có tỉ lệ Bounce Rate thấp là: Đưa vào viết liên quan, Thiết kế giao diện dễ nhìn bắt mắt, Tối ưu tốc độ tải trang web … đăng viết có nội dung tập trung vào chủ đề trở thành đặc trưng website Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -19- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm New Visit: Tỉ lệ khách truy cập Con số thực khơng có ý nghĩa với Website/Blog tiếng Việt Việt Nam sử dụng địa IP động cho thấy phần hiệu chiến dịch quảng cáo cơng cụ tìm kiếm Exit Pages: Exit Pages có nghĩa trang mà khách truy cập thoát khỏi website Dựa vào thơng số biết thêm thơng tin khách hàng muốn website 10 Visitors Returners: Là thông số thống kế số lần khách quay trở lại để truy cập website Những nhà phân tích, thống kế web dựa vào số liệu để biết trang web có thực hữu dụng u thích hay khơng? Visitors Returners lớn có nghĩa website hấp dẫn thu hút khách viếng thăm 11 Hit: Số hit website thường số lớn Mỗi tập tin gửi đến trình duyệt máy chủ web tính hit Cụ thể hơn, ta thử tính số hit click vào trang web có 20 ảnh phần (anhnen.gif, anh-tren-cung.gif, anh-chuyển-sắc.gif…) tải 20 hit Kế đến, trang web cịn chứa 10 hình dã ngoại (saigon.jpg, cantho.gif…) ta thu thêm 10 hit Kết thúc phần hình ảnh, ta cịn phải tính đến tập tin CSS, Javascript, Flash (swf hay flv), HTML tập tin tương ứng hit Do đó, trang web tải, hệ thống đếm 50 hit tùy thuộc thành phần nội dung có trang web 12 Impression: thuật ngữ số lần xuất nhân tố (hình ảnh, text, video) trang web Impression thường dùng gói dịch vụ marketing (quảng cáo) tính theo gói 1.000 Ví dụ nhà cung cấp dịch vụ quảng cáo Google Adsense trả phí 54.000 đồng/CPM (Cost Per Thousand Impressions – Chi phí cho 1.000 lần xuất hiện) có nghĩa webmaster nhận 54.000 đồng banner quảng cáo Google Adsense xuất 1.000 lần trang web Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -20- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm Tổng kết Trong thời đại Công nghệ thông tin bùng nổ nay, Người sử dụng bị kẹp chặt khối liệu, thông tin, kiến thức khổng lồ Vậy để phát huy tận dụng kiến thức Việc áp dụng công nghệ tri thức để tận dụng, lọc thông tin cần thiết phục vụ cho nhu cầu mục đích khác giúp người sử dụng hạn chế kinh phí đầu tư, thúc đẩy trình phát triển nhiều Nếu biết tận dụng chức có sẵn ứng dụng Google Analytics, nhà quản trị website nắm bắt trang web điều hành dễ hơn, giúp trang web ngày hoàn thiện Cuối cám ơn Thầy Hồng Văn Kiếm cho chúng tơi nhiều kiến thức bổ ích để hồn thiện báo cáo này, có kiến thức ứng dụng vào thực tế tốt Trân trọng! Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -21- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm TÀI LIỆU THAM KHẢO Sách [1] Giáo trình khai phá liệu Web NXB Giáo dục 2012 (tái bản) Tác giả : Hà Quang Thụy (chủ biên) [2] Slides giảng chuyên đề ‘‘CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG’’ Tác giả : GS.TSKH Hoàng Kiếm Internet [3] http://www.google.com/analytics/ [4] http://en.wikipedia.org/wiki/Data_mining [5] http://thuvien247.net/Khai-pha-du-lieu-Bai-giang-t10372.html [6] http://nhanminhphuc.edublogs.org/2011/03/18/data-mining-khai-niem-vai-tro[7] va-ung-dung http://forum.bachkhoa-npower.vn/193-bai-1-gioi-thieu-google-analytics.html Ebook [8] Web Data Mining-Bing Liu, Springer publish [9] Introduction to Data Mining - Pang Ning Tan, Michael Steinbach, Vipin Kumar Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -22- ... -8- Đề tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hoàng Văn Kiếm II Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn. .. tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm MỤC LỤC Lê Xuân Nguyên - Nguyễn Thị Phương Trang – CNTT K6 -2- Đề tài: Ứng dụng Data. .. tài: Ứng dụng Data mining vào Analytics để chuẩn hóa website Hungvuong.edu.vn Giảng viên: GS TSKH Hồng Văn Kiếm Hình : Cách thức hoạt động Google Analytics Đối với Google Analytics người sử dụng

Ngày đăng: 10/04/2015, 16:27

Từ khóa liên quan

Mục lục

  • LỜI MỞ ĐẦU

  • I. Tổng quan về Data mining

  • II. Ứng dụng Data mining vào Analytics để chuẩn hóa

  • website Hungvuong.edu.vn

  • PHỤ LỤC CÁC THUẬT NGŨ SỬ DỤNG TRONG

  • GOOGLE ANALYTICS

  • Tổng kết

  • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan