BTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên website

18 795 8
BTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên website

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên website, ho tro mua laptop tren website,BTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên websiteBTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên websiteBTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên websiteBTL nhan dang sử dụng thuật toán KNN hỗ trợ người dùng mua laptop trên website

Mục lục Lời Mở Đầu Máy tính xách tay - laptop phương tiện để làm việc hiệu Vậy yếu tố quan trọng để lựa chọn máy tính xách? Bài viết đưa yếu tố người dùng nên tham khảo trước định chọn mua laptop Giờ đây, smartphone tablet nhỏ gọn thay laptop bạn phải di chuyển, nhiên muốn công việc có hiệu cao, thao tác nhanh xác bạn thiếu máy tính xách tay Các công việc đánh máy nhanh, chỉnh sửa video, hay thiết kế đồ họa, chỉnh sửa ảnh… cần đến công cụ thực chuyên nghiệp Thị trường có nhiều loại laptop với kích cỡ, tính giá Với người dùng, lựa chọn khó khăn, lời khuyên hữu ích dành cho bạn nên tập trung vào nhu cầu làm việc để lựa chọn I Giới thiệu Máy tính xách tay Máy tính xách tay hay máy vi tính xách tay (tiếng Anh: laptop computer hay notebook computer) máy tính cá nhân gọn nhỏ mang xách Nó thường có trọng lượng nhẹ, tùy thuộc vào hãng sản xuất kiểu máy dành cho mục đích sử dụng khác Máy tính xách tay có đầy đủ thành phần máy tính cá nhân thông thường Chiếc máy tính xách tay giới Osborne đời năm 1981 Tuy có đầy đủ chức máy tính cá nhân thông thường, máy tính xách tay với không gian nhỏ gọn nên đặc điểm sau có khác biệt so với máy tính cá nhân Chi tiết thiết bị hệ thống máy tính cá nhân thông thường xem riêng chúng • Đặc điểm thiết kế:  Hệ điều hành : Hệ điều hành (OS) thành phần bắt buộc phải có máy tính xách tay Nó bổ nhiệm quản lý chương trình ứng dụng máy tính.Hệ điều hành có nhiều loại:Microsoft Windows, Mac OS, Linux,  Bộ xử lý: Bộ xử lý thiết kế riêng với trọng vào hiệu tiết kiệm lượng, chúng thay đổi tốc độ làm việc tuỳ theo yêu cầu hệ thống Để hạ giá thành sản phẩm, số máy tính xách tay sử dụng xử lý máy tính cá nhân để bàn (thường ít)  Ram: RAM: Máy tính xách tay sử dụng loại RAM (So-DIMM) dành riêng, chúng ngắn (và thường rộng hơn) RAM (Long-DIMM) thông thường cho máy tính cá nhân để bàn Một máy tính xách tay thường thiết kế hai khe cắm RAM (mà thường sản xuất chúng gắn RAM khe để người dùng nâng cấp)  Ổ đĩa cứng: Ổ đĩa cứng máy tính xách tay loại ổ (2,5") có kích thước nhỏ ổ cứng máy tính thông thường (3,5"), chúng sử dụng giao tiếp ATA truyền thống SATA máy sản xuất gần  Chức đồ họa : Chức Đồ hoạ: Thường tích hợp chipset tích hợp bo mạch chủ Đa phần máy tính xách tay phổ thông tầm trung sử dụng chức đồ hoạ tích hợp chipset sử dụng nhớ đồ hoạ chia sẻ từ RAM hệ thống Các máy tính xách tay cao cấp xử lý đồ hoạ tách rời gắn trực tiếp bo mạch chủ, chúng có RAM riêng sử dụng phần RAM hệ thống  Màn hình : Màn hình máy tính xách tay ngày thuộc loại hình tinh thể lỏng, chúng gắn trực tiếp với thân máy tách rời Một số máy tính xách tay thiết kế hình quay gập lại che bàn phím - kết hợp với thể loại thường hình cảm ứng.Hiện người ta chế tạo loại máy tính xách tay tháo rời hình,nhưng loại chưa phổ biến giá đắt  Pin : Nguồn sử dụng lưới điện dân dụng máy tính xách tay thiết kế bên khối máy để tiết kiệm không gian Nguồn phận quan trọng máy tính để bàn MTXT Điện cấp cho máy tính xách tay có cấp điện áp chiều có mức điện áp thường thấp 24 Vdc Năng lượng cung cấp cho máy tính xách tay không sử dụng nguồn điện dân dụng pin  Bàn Phím : Bàn phím máy tính xách tay thường không tuân theo tiêu chuẩn bàn phím máy tính cá nhân thông thường Ngoài phím chức thường thấy (như F1, F2 đến F12) bàn phím thông dụng máy tính cá nhân, máy tính xách tay có loạt phím chức dành riêng khác, phím thường chức thứ hai kích hoạt sau bấm phím chuyển đổi thường có ký hiệu Fn  Kết nối mạng : Đa phần máy tính xách tay tích hợp sẵn điều hợp mạng không dây theo chuẩn thông dụng với điều hợp mạng Ethernet thông thường Hình thức kết nối Internet quay số Wi-Fi Bluetooth  Đa phương tiện: • Loa tích hợp sẵn máy tính xách tay chúng có chất lượng công suất thấp Webcam, Micro thường tích hợp số máy tính xách tay sản xuất năm gần Chúng có công dụng giúp người sử dụng gọi điện nói chuyện thông qua mạng Internet • Touchpad: Là bàn di chuột dùng để điều khiển chuột máy tính với phím trái phải chuột máy tính để bàn nằm bàn phím Định nghĩa toán  II Với liệu đồ sộ Laptop có lap top thị trường ta không cần phải phân tích kĩ bên để mua máy tính ưng ý Bằng liệu có sẵn thuộc tính cá thể ta cỏ thề đưa nhận biết nhanh chóng cá thể thuộc Hãng máy tính tính toán số học mảy Tính (Machine Learning) III Thu thập xử lý số liệu Ta thu thập liệu laptop từ cấu hình bên lẫn bên máy tính theo nhu cầu mua máy tính thị trường Bộ liệu sau rút gọn bao gồm thuộc tính thuộc tính quy định: • Hãng • • • APPLE DELL LENOVO ASUS ACER HP Gía Màn hình Bộ vi xử lý i3 i5 i7 khác Bộ nhớ Ram Bộ nhớ ổ cứng Hệ điều hành dos mac-os win win win 8.1 win 10 • Card đồ họa: có 1 ko • Màu sắc trắng đen đỏ bạc • • • 5 xanh xám vàng khác theo tổng kết thống kê: Gía trị lớn Giá trị nhỏ Giá trị trung bình Gía 39990000 5099000 22544500 Màn hình 11,6 15,6 13,6 Bộ xử lý Bộ nhớ ram 16 Bộ nhớ ổ cứng 1024 256 640 Hệ điều hành 3,5 Card đồ họa 0,5 Màu sắc 4,5 Tỷ lệ phân chia cho loại hãng máy tính 16,6% a làm liệu Thiếu giá trị: xây Sự thiếu thông tin thuộc tính trang ghi liệu thu thập, mả tính đảm bảo số bán ghi chia cho loài có ( 33,3%) vả sồ lượng ghi thiểu ta cỏ thề áp dụng phương pháp loại bo.(thực tề liệu trên, khống tồn giá trị thuộc tính bị thiếu hay không điền).mặt khác cần phải điền vài gỉá trị thiếu, ta áp dụng phương pháp điền tự động, thay giá trị thiếu giả trị trung bình thống kê Nhiễu liệu: xuất giả trị bất ngờ đó, vượt giá trị biên thong kê, ta có thề sửa lại giá trị thành giá trị vùng biên theo bàng thống kế b chọn lọc liệu Tích hợp vá du thừa liệu : liệu thu thập từ nguồn nên việc tích hợp không cần thiết, thuộc tính liệu độc lập nhau, mối quan hệ tương quan nào, thuộc tính rút gọn chọn lọc nên không cần việc phân tích du thừa liệu c biến đổi liệu Biến đồi liệu: ta sử dụng phương pháp chuẩn hóa liệu khoảng giá trị [0,1], phấn sê nói rô phấn sau tùy vào phương pháp khai phá liệu lựa chọn d rút gọn liệu Như nói từ đầu, liệu loại bỏ thuộc lính mang tính chất mô tả, chì giữ lại Ihuộc tính mô tả tên Hãng cụ thể thuộc tính mang tính số học lại đảm bảo tính phân loại IV Khai phá liệu Dựa vào phát biểu mục đích cùa bái toán, dễ dàng nhận thầy bải toán phân lớp: với liệu cho gán nhãn lớp cho trước(thể thông qua thuộc tính Hãng máy tính cụ thể), ta cần gắn mẫu (chưa biết thuộc nhãn lớp nào) vào lớp với độ xác cao cố thể Bộ liệu chọn có Bộ thuộc tính không lớn, để đơn giản dễ sử dụng để phân lớp ta lựa chọn dùng phản lớp Iheo Ihuât toán “k- người hàng xóm gần nhất* (kNearest Neighbor Algorithm) Thuật toán K-người hàng xóm gần Thuật toán k-người hàng xóm gần (viết tắt K-NN) thuật toán có mục đích phân loại lớp cho mẫu (Query point) dựa thuộc tính lớp mẫu sẵn có (Tratntng Data), mẫu nằm hệ gọi không gian mẫu Một đối tượng phân lớp dựa vào K láng giềng K số nguyên dương xác định trước thực thuật toán Người ta thưởng dùng khoảng cách Euclidean đề tính khoảng cách gtữa đối tượng Mô tả thuật toán KNN Các mẫu mô tà n - chiều thuộc tính số Mỗi mẫu đại diện cho điểm chiều không gian n - chiều.Theo cách tất mẫu lưu trữ mô hình không gian n - chiều Các bước thực thuật toán K-NN mô tả sau: 1/ Xác định tham số K (số láng giềng gần nhất) 2/ Tính khoảng cách đối tượng cần phân lớp (Query Point) với tất đối tượng training data (thường sử dụng khoảng Euclidean) 3/ Sắp xếp khoảng cách theo thứ tự tăng dần xác định K láng giềng gần với Query Point 4/ Lấy tất lớp K láng giềng gần xác định 5/ Dựa vào phần lớn lớp láng giềng gần để xác định lớp cho Query Point Đề hiểu K-NN dùng đề phân lớp thể ta xem minh họa đây: Trong hình đây, training Data mô tả bời dấu (+) dấu (-), đối tượng cần xác định lớp cho (Query point) hình mặt cười Nhiệm vụ ước lượng (hay dự đoán) lớp Query point dựa vào việc lựa chọn sổ láng giềng gần với Nói cách khác muốn biết liệu Query Point sẽ phân vào lớp (+) hay lớp (-) Ta thấy rằng: 12- Nearest neighbor : Kểtquả + (Query Point xếp vào lớp dấu +) Nearest neighbors : không xác định lớp cho Query Point số láng giềng gần nhẩt với lớp + lớp - (không có lớp có số đối tượng nhiều lớp kia) Vẩn đề sẽ nói rõ cụ thề phần sau 5- Nearest neighbors : Kết là- (Query Point đuợc xếp vào lớp dấu - láng giềng gần với có đối tượng thuộc lớp - nhiều lớp + có đồi tượng) Áp dụng thuật toán KNN vào toán phân lớp máy tính “Sự gần gũi” xác định khoảng cách Euclide, với khoảng cách Euclide hai điềm: X=(x1, x2, x3, , xn) Y=(y1, y2 , y3, , yn ) là: Sự phân loại lớp cho mẫu chưa biết lúc dựa chiếm đa số lớp " k - người hàng xóm gần " tìm Ở ta cần biến đồi liệu hiệu thuật toán đuợc nâng cao Cần lưu ý rằng: + Khoảng cách Eudide bị ảnh hường khoảng giới hạn giá trị thuộc tính + Khoảng giá trị lớn gây nhiều ảnh hưởng so với khoảng giá trị nhỏ Dù khoảng cách mẫu có thề bị chi phối số thuộc tính có giá trị tương đối lớn so với thuộc tính khác Vì ta có thề khắc phục cách bình thường hóa số thuộc tính cách chia giá trị thuộc tính thuộc mẫu cho giá trị lớn thuộc tính tất mẫu, làm giá trị sau bình thường hóa nằm khỏang [0,1] 10 Áp dụng vào toán phân lớp Máy tính: ??? 11 Trích dẫn từ liệu Laptop, ta lập bảng liệu nhỏ tiến hành thực theo thuậl toán K-NN đề minh họa: Gía Màn hình Bộ xử lý Bộ nhớ ram Bộ nhớ ổ cứng Hệ điều Card hành đồ họa Màu sắc Hãng 5099000 11.6 500 0 Acer 21990000 13.3 4 128 15999000 15.6 1024 1 12699000 15.6 500 10999000 15.6 500 10499000 14 500 13999000 15.6 500 39999000 12 512 12399000 15.6 500 15199000 15.6 1024 Apple Asus Dell Hp Lenovo Lenovo Apple Hp Dell 12000000 15.6 500 ??? Ta tiến hành thường hóa liệu, bảng liệu sẽ bị biến đổi thành bảng sau: (ta lấy giá trị cột bảng chia cho giá trị lớn theo cột) Gía Màn hình Bộ xử lý Bộ nhớ ram Bộ nhớ ổ cứng Hệ điều Card hành đồ họa Màu sắc Hãng 0.13 0.74 0.25 0.25 0.49 0.17 0.00 0.00 0.55 0.85 1.00 0.50 0.13 0.33 0.00 0.14 0.40 1.00 0.75 0.50 1.00 0.17 1.00 0.29 0.32 1.00 0.50 0.50 0.49 0.17 0.00 0.29 0.27 1.00 0.25 0.50 0.49 0.17 0.00 1.00 0.26 0.89 0.25 0.50 0.49 0.17 0.00 0.29 0.35 1.00 0.5 0.50 0.49 1.00 1.00 0.29 1.00 0.77 1.00 1.00 0.50 0.33 0.00 0.86 0.31 1.00 0.25 0.50 0.49 0.17 0.00 0.57 0.38 1.00 0.25 1.00 1.00 1.00 0.00 0.57 0.30 1.00 0.25 0.50 0.50 0.50 1.00 0.29 Acer Apple Asus Dell Hp Lenovo Lenovo Apple Hp Dell ??? 12 Ta tính khoảng cách Eclide bảng khoảng cách tương ứng (khoảng cách từ máy tới máy cần phân loại) Hãng Khoảng cách Acer =1.4 Apple =1.35 Asus =0.79 Dell =1.08 HP =1.27 Lenovo =1.06 Lenovo =0.5 Apple =1.66 HP =1.09 Dell =1,47 13 Chọn K = Ta chọn K hàng xóm gần khoảng cách nhỏ : 0.5, 0.79 1.06 tương ứng với hãng : Lenovo,Lenovo, Asus Trong hàng xóm gần có hàng xóm Lenovo hàng xám Asus Vậy kết luận máy Laptop cần tư vấn thuộc loại Lenovo Trong trường hợp chọn K xảy trường hợp có số hàng xóm lớp ta tiến hành thêm bước tính trung bình lớp sau chọn lớp có sô trung bình nhỏ để phân lớp 14 V Đánh giá độ xác mô hình chương trình chạy Đánh giá độ xác: • Ước lượng độ xác phân lớp quan trọng cho phép dự đoán độ xác kết phân lớp liệu tương lai phương pháp thực bước sau: Một cách tổng quát ,tập luyện lớn việc phân lớp tốt hơn, tập kiểm tra lớn sẽ việc đánh giá lỗi thông thường người ta chọn tập luyện 2/3 tập kiểm tra 1/3 Trong trường hợp số phần tử lớp tập liệu gốc không ví dụ y học lớp khỏe mạnh chiếm 90% lớp bệnh tật chiếm 10%, chọn ngẫu nhiên tập kiểm tra sẽ không đánh giá tỷ lệ lỗi Để khắc phục, ta chọn ngẫu nhiên lớp số phần tử cho tập kiểm tra 1/3 số phần tử lớp 15 16 Chương trình chạy: Giao diện chính: Nhập liệu vào bảng liệu dành riêng cho người quản trị có xóa thêm liệu 17 Giao diện tư vấn mua lap top Cần nhập thông tin laptop cần mong muốn ấn nút tư vấn: Khi click nút tư vấn máy sẽ tính toán đưa tư vấn cụ thể cho người cần tư vấn 18 [...]... phần tử lớp 15 16 2 Chương trình chạy: Giao diện chính: Nhập dữ liệu vào bảng dữ liệu dành riêng cho người quản trị ở đó có xóa và thêm dữ liệu 17 Giao diện tư vấn mua lap top Cần nhập thông tin của laptop cần mong muốn và ấn nút tư vấn: Khi click và nút tư vấn máy sẽ tính toán và đưa ra tư vấn cụ thể cho người cần tư vấn 18 ...Áp dụng vào bài toán phân lớp Máy tính: ??? 11 Trích dẫn từ bộ dữ liệu Laptop, ta lập ra 1 bảng dữ liệu nhỏ và tiến hành thực hiện theo thuậl toán K-NN đề minh họa: Gía Màn hình Bộ xử lý Bộ nhớ ram Bộ nhớ ổ cứng Hệ điều Card hành đồ họa Màu sắc Hãng 5099000 11.6 1 2 500 1... dữ liệu trong tương lai phương pháp được thực hiện trong 2 bước sau: Một cách tổng quát ,tập luyện lớn hơn thì việc phân lớp tốt hơn, tập kiểm tra lớn hơn sẽ đúng hơn về việc đánh giá lỗi thông thường người ta chọn tập luyện bằng 2/3 và tập kiểm tra bằng 1/3 Trong trường hợp số phần tử của các lớp trong tập dữ liệu gốc là không đều ví dụ như về y học thì lớp khỏe mạnh chiếm 90% còn lớp bệnh tật chiếm... thì 3 khoảng cách nhỏ nhất lần lượt là : 0.5, 0.79 và 1.06 tương ứng với các hãng : Lenovo,Lenovo, Asus Trong 3 hàng xóm gần nhất này có 2 hàng xóm là Lenovo và 1 hàng xám lá Asus Vậy là kết luận máy Laptop cần tư vấn thuộc loại Lenovo Trong trường hợp nếu chọn K xảy ra trường hợp có số hàng xóm mỗi lớp bằng nhau thì ta tiến hành thêm bước tính trung bình lần lượt của mỗi lớp sau đó chọn lớp nào có ... đơn giản dễ sử dụng để phân lớp ta lựa chọn dùng phản lớp Iheo Ihuât toán “k- người hàng xóm gần nhất* (kNearest Neighbor Algorithm) Thuật toán K -người hàng xóm gần Thuật toán k -người hàng xóm... giềng K số nguyên dương xác định trước thực thuật toán Người ta thưởng dùng khoảng cách Euclidean đề tính khoảng cách gtữa đối tượng Mô tả thuật toán KNN Các mẫu mô tà n - chiều thuộc tính số Mỗi... trung sử dụng chức đồ hoạ tích hợp chipset sử dụng nhớ đồ hoạ chia sẻ từ RAM hệ thống Các máy tính xách tay cao cấp xử lý đồ hoạ tách rời gắn trực tiếp bo mạch chủ, chúng có RAM riêng sử dụng

Ngày đăng: 24/12/2016, 01:03

Từ khóa liên quan

Mục lục

  • Lời Mở Đầu

    • I. Giới thiệu về Máy tính xách tay

    • II. Định nghĩa bài toán

    • III. Thu thập và xử lý số liệu

      • a. làm sạch dữ liệu

      • b. chọn lọc dữ liệu

      • c. biến đổi dữ liệu

      • d. rút gọn dữ liệu

      • IV. Khai phá dữ liệu

        • 1. Thuật toán K-người hàng xóm gần nhất là gì

        • 2. Mô tả thuật toán KNN

        • 3. Áp dụng thuật toán KNN vào bài toán phân lớp máy tính

        • V. Đánh giá độ chính xác của mô hình và chương trình chạy

          • 1. Đánh giá độ chính xác:

          • 2. Chương trình chạy:

Tài liệu cùng người dùng

Tài liệu liên quan