Phương pháp lan truyền độ tương tự trong phân cụm dữ liệu và ứng dụng

63 266 1
Phương pháp lan truyền độ tương tự trong phân cụm dữ liệu và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TẠ DUY KHÁNH PHƯƠNG PHÁP LAN TRUYỀN ĐỘ TƯƠNG TỰ TRONG PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TẠ DUY KHÁNH PHƯƠNG PHÁP LAN TRUYỀN ĐỘ TƯƠNG TỰ TRONG PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN ĐÌNH HÓA Thái Nguyên - 2015 ii LỜI CÁM ƠN Đầu tiên, xin gửi lời cảm ơn sâu sắc đến thầy giáo, cán hướng dẫn khoa học PGS.TS Nguyễn Đình Hóa tận tình hướng dẫn từ buổi tiếp cận với đề tài khoa học Trong trình làm luận văn, nhận giúp đỡ nhiệt tình từ nhóm nghiên cứu TS Lê Hoàng Sơn Trung tâm tính toán hiệu cao, trường ĐH KHTN đề tài NCKH cấp ĐHQG, mã số GG.14.60 Tôi xin bày tỏ lòng biết ơn đến thầy cô giáo trường Đại học Công nghệ thông tin Truyền thông – Đại học Thái Nguyên, cán Trung tâm Đông Đô - Hà Nội, tận tình giảng dạy tạo điều kiện cho học tập, nghiên cứu hoàn thành luận văn Tôi xin chân thành cảm ơn bạn học viên lớp CK12H, CK13H – Khoa học máy tính giúp đỡ, tạo điều kiện cho suốt trình học tập thực luận văn Cuối cùng, xin gửi lời cảm ơn sâu sắc đến gia đình, đồng nghiệp bạn bè tôi, người động viên, tạo điều kiện cho lao động học tập suốt thời gian qua Tôi xin cam đoan luận văn công trình nghiên cứu riêng cá nhân tôi, không chép Luận văn tự nghiên cứu, đọc, dịch tài liệu, tổng hợp thực Nội dung lý thuyết luận văn có sử dụng số tài liệu tham khảo trình bày phần tài liệu tham khảo Chương trình phần mềm kết luận văn trung thực chưa công bố hệ thống khác Một lần nữa, xin chân thành cảm ơn! i MỤC LỤC LỜI CÁM ƠN i MỤC LỤC………………………………………………………………………ii DANH MỤC CÁC TỪ VIẾT TẮT iv DANH MỤC CÁC HÌNH VẼ v MỞ ĐẦU CHƯƠNG 1: HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ PHÂN CỤM DỮ LIỆU ĐỊA LÝ 1.1 Tổng quan hệ thống thông tin địa lý 1.1.1 Lịch sử đời 1.1.2 Định nghĩa 1.1.3 Các thành phần hệ thống thông tin địa lý 1.1.4 Dữ liệu hệ thống thông tin địa lý 1.2 Phân cụm liệu địa lý 10 1.2.1 Phân cụm liệu 10 1.2.2 Một số kỹ thuật phân cụm liệu 11 1.2.2.1 Thuật toán phân cụm theo phân cấp 12 1.2.2.2 Thuật toán phân cụm phân hoạch : Phân cụm k-means 13 1.2.2.3 Phân cụm mờ 14 1.3 Dữ liệu địa lý vấn đề phân cụm đối tượng địa lý 16 1.3.1 Cấu trúc liệu GIS 16 1.3.1.1 Hai mô hình liệu không gian 16 1.3.1.2 Dữ liệu thuộc tính 18 1.3.2 Các vấn đề phân cụm liệu địa lý 18 CHƯƠNG 2: PHÂN CỤM BẰNG THUẬT TOÁN LAN TRUYỀN ĐỘ TƯƠNG TỰ 20 2.1 Các khái niệm sở 20 2.1.1 Ý tưởng thuật toán 20 2.1.2 Các công thức thuật toán AP 22 2.1.3 Thuật toán AP nguyên thủy 23 2.2 Thuật toán lan truyền AP tự thích nghi 25 2.2.1 Phương pháp thích ứng giảm dần 26 2.2.2 Kỹ thuật thích nghi p-scanning 27 ii 2.3 Thuật toán lan truyền AP với tập liệu hỗn hợp kiểu số kiểu phân loại 29 2.3.1 Khoảng cách ý nghĩa 30 2.3.2 Phương pháp 30 2.3.3 Cải thiện độ đo tương tự 32 2.3.4 Thích nghi thuật toán lan truyền 34 CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG PHÂN CỤM DỮ LIỆU ĐỊA LÝ 37 3.1 Bài toán thực tế cách tiếp cận phân cụm liệu 37 3.1.1 Bài toán khai thác liệu quan trắc khí tượng 37 3.1.2 Lựa chọn giải pháp kỹ thuật công nghệ 38 3.2 Các phần mềm GIS 38 3.3 Tìm hiểu phần mềm mã nguồn mở MapWindow 40 3.4 Thiết kế plug-in phần mềm mã nguồn mở Mapwindown 42 3.4.1 Thêm plug-ins từ Visual Studio vào MapWindow 42 3.4.2 Xây dựng ứng dụng với Active X map control Visual Studio 43 Kết chạy thử nghiệm 51 KẾT LUẬN 54 Một số kết đạt luận văn 54 Những hạn chế hướng phát triển 54 TÀI LIỆU THAM KHẢO 55 iii DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt GIS Từ tiếng Anh Ý nghĩa Geographical Hệ thống thông tin địa lý Information System AP affinity propagation Thuật toán lan truyền độ tương tự CSDL Database Cơ sở liệu SIL Silhouette Công thức Silhouette DEM Digital Elevation Model Mô hình kỹ thuật số độ cao DTM Digital Terrain Model Mô hình kỹ thuật số địa hình TIN Triangulated Irregular Lưới tam giác không Network SQL Structured Query Ngôn ngữ truy vấn có cấu trúc Language iv DANH MỤC CÁC HÌNH VẼ Hình 1.1: Các thành phần hệ thống thông tin địa lý Gis Hình 1.2: Thuật toán phân cụm K-means Hình 1.3: Cấu trúc vector raster Hình 2.1: Đồ thị Affinity Propagation (AP) Hình 2.2: Minh họa hiệu ba kỹ thuật rời rạc hóa khác Hình 3.1: Phần mềm mã nguồn mở Mapwindow Hình 3.2: Kiếm tra plug-ins vừa add MapWindow Hình 3.3: Kéo thả Map Control vào form Hình 3.4: Kéo Legend vào form Hình 3.5: Kéo thêm DataGridView vào form Table Hình 3.6: Giao diện plugin APCluster v MỞ ĐẦU Đặt vấn đề Nguồn liệu dồi cung cấp nhiều thông tin, từ nhân loại đúc rút thành tri thức trình phát triển xã hội loài người Với phát triển công nghệ điện toán hệ thống lưu trữ liệu khối lượng tài nguyên số ngày trở nên phong phú đồ sộ Trong xã hội đại, thông tin đóng vai trò then chốt Nhu cầu xử lý liệu, trích rút thông tin, kịp thời khai thác chúng để mang lại hiệu thiết thực cho công tác quản lý, hoạt động sản xuất kinh doanh,… ngày trở nên cấp thiết Khai phá liệu nói chung để trích rút thông tin phân cụm liệu nói riêng trọng tâm nghiên cứu khoa học máy tính Phân cụm liệu biện pháp để tìm kiếm tri thức, ta chưa biết nhiều thông tin miền ứng dụng Phân cụm coi công cụ độc lập để xem xét phân bố liệu, bước tiền xử lý cho bước sau Phân cụm liệu có nhiều ứng dụng hầu hết lĩnh vực hoạt động kinh tế, xã hội Có nhiều phương pháp thuật toán phân cụm liệu khác nhau, tùy theo cách tiếp cận toán góc độ Một phương pháp đề xuất tương đối gần Phương pháp lan truyền độ tương tự Thuật toán lan truyền độ tương tự (Affinity Propagation - AP) thuật toán phân cụm liệu đưa Frey & Dueck vào năm 2007 dựa ý tưởng thuật toán lan truyền độ tin cậy suy diễn mạng xác xuất Bayes, dựa sở toán học lý thuyết xác suất Thuật toán lan truyền làm việc dựa tương đồng (affinity nghĩa giống nhau, tương thích, hấp dẫn) cặp điểm liệu đồng thời xem xét tất điểm liệu tâm cụm tiềm năng, theo thuật ngữ tất điểm liệu hình mẫu (exemplar) tiềm năng, trao đổi thông điệp giá trị thực có tập hình mẫu tốt (phân cụm tương ứng) Thuật toán phân cụm AP có số ưu điểm: cho kết phân cụm tốt, đặc biệt trường hợp có số lượng lớn cụm, phát cụm có hình dáng bất kỳ, không yêu cầu phải xác định trước số cụm Nó cho phép dễ dàng thực phân cụm thỏa mãn số điều kiện xác định trước đó, tức phân cụm bán giám sát Đặc tính thích hợp cho phân cụm liệu GIS ràng buộc điều kiện địa hình tự nhiên quản lý hành cần tính đến toán thực tế Luận văn chọn đề tài “Phương pháp lan truyền độ tương tự phân cụm liệu ứng dụng” hướng nghiên cứu chính, với mục tiêu khám phá điểm mạnh, điểm yếu phương pháp này, hiểu biết sâu thêm cách tiếp cận phân cụm, đồng thời nâng cao kỹ thực hành triển khai ứng dụng Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu phương pháp phân cụm liệu, tập trung vào thuật toán lan truyền độ tương tự Phạm vi nghiên cứu điểm mạnh, điểm yếu tiềm ứng dụng phương pháp lan truyền độ tương tự phân cụm liệu địa lý Hướng nghiên cứu đề tài Luận văn dự kiến hướng nghiên cứu là: Nghiên cứu lý thuyết: tìm hiểu sâu thuật toán lan truyền độ tương tự, sở nắm vững chất phương pháp lan truyền độ tin cậy suy diễn mạng xác xuất Bayes dựa sở toán học lý thuyết xác suất Nghiên cứu ứng dụng: Cài đặt thử nghiệm thuật toán với liệu mô để đánh giá, phân tích đánh giá kết quả; thử với liệu thực tế Những nội dung nghiên cứu Nội dung nghiên cứu luận văn bao gồm: Tìm hiểu tổng quan phân cụm liệu; điểm đặc thù toán phân cụm liệu địa lý; Một số đặc điểm thuật toán lan truyền độ tương tự, sở lý thuyết toán học phân tích thực nghiệm Về thực hành: Cài đặt thử nghiệm thuật toán với liệu mô để đánh giá, phân tích đánh giá kết quả; thử với liệu thực tế Làm quen với hệ thống thông tin địa lý nguồn mở; sở liệu địa lý; cách viết plugin tích hợp phép phân tích liệu địa lý Phương pháp nghiên cứu Phương pháp nghiên cứu lý thuyết: tổng quan, phân tích kết nghiên cứu có, nhận biết ưu nhược điểm, lựa chọn cách tiếp cận phù hợp để giải toán ứng dụng Nghiên cứu thực nghiệm qua phân tích kết thử nghiệm với liệu mô phỏng; liệu thực tế; so sánh đánh giá kết luận Ý nghĩa khoa học đề tài Đề tài nghiên cứu có ý nghĩa khoa học, góp phần làm hiểu biết sâu sắc phương pháp lan truyền độ tương tự phân cụm liệu Ứng dụng thực tế: phân cụm liệu môi trường, không khí, thời tiết… nhận từ trạm quan trắc khí tượng để xác định tiểu vùng môi trường khí tượng địa phương, khu vực Bố cục luận văn Luận văn bao gồm chương với phần Mở đầu, phần Kết luận, phần Mục lục, phần Tài liệu tham khảo Chương 1: Tổng quan phân cụm liệu GIS phân cụm liệu địa lý: Trình bày khái niệm bản, cách tiếp cận, phương pháp, thuật toán; Chú trọng kết biết đánh giá điểm mạnh điểm yếu  Ngôn ngữ: Visual C++, C#, Visual Basic, Visual Basic NET and Delphi 3.4 Thiết kế plug-in phần mềm mã nguồn mở Mapwindown 3.4.1 Thêm plug-ins từ Visual Studio vào MapWindow  Bước 1: Tạo project VS, chọn ngôn ngữ C#.NET, loại Class Library, framework Net 3.5  Bước 2: add reference cho project cách: o Bấm Chuột phải vào tên project, chọn properties o Trên form properties, chọn tab reference, click button Add Tại form Reference Manager, chọn Menu Browse, click button Browse đến thư mục C:\Program Files MapWindow, check chọn thư mục: MapWinGIS.ocx MapWininterfaces.dll Click OK để add reference, sau set thuộc tính Copy Local file reference False  Bước 3: Quay trở lại form Reference Manager, chọn Menu Assemblies\Framework, check chọn System.Drawing, bấm OK để add vào Reference  Bước 4: Quay trở lại hình Code, thêm dòng using MapWindow.Interfaces; Trên đầu trang mã khác using bên cạnh dòng “Public Class Class1” thêm “: Iplugin” nhấn Implement Interface để VS tự gen đoạn code  Bước 5: Tìm đến thuộc tính Author, Description, Name Version hình code, bỏ dòng get{throw new NotImplementedException();} thay get { return "tên thuộc tính";}, riêng thuộc tính BuilDate thay get{ return System.DateTime.Now.ToString(); }, 42 thuộc tính SerialNumber thay get{ return null;} sau build project  Bước 6: Copy file DLL vừa tạo vào thư mục C:\Program Files \MapWindow (Ấn chuột phải vào tên project lại Solution Explorer, chọn Open Folder in File Explorer để tìm đến thư mục chứa DLL)  Bước 7: Kiểm tra việc add plug-ins MapWindow: Mở MapWindow, vào menu Plug-ins thấy plug-ins vừa tạo add vào Bấm chọn plug-ins để sử dụng plug-in project MapWindow Hình 3.2: Kiếm tra plug-ins vừa add MapWindow 3.4.2 Xây dựng ứng dụng với Active X map control Visual Studio Active X map control với MapWinGIS.ocx sử dụng để cung cấp chức GIS lập đồ cho ứng dụng Windows Forms MapWinGIS.ocx nguồn mở miễn phí, lập trình dựa hệ thống thông tin địa lý điều khiển ActiveX lập trình giao diện ứng dụng (API) thêm vào Windows Visual Basic, C #, Delphi, ngôn ngữ khác có hỗ trợ ActiveX, cung cấp ứng dụng với đồ 43 Cài đặt Active X map control 4.9.3.5 Link download đây: http://mapwingis.codeplex.com/releases/view/541892 Để đưa Active X map control vào form Visual studio ta làm sau:  Bước 1: Tạo project VB, ngôn ngữ C#.NET, loại ứng dụng Windows Forms Application, framework NET 3.5 Sau tạo thành công mộtWindow form Application, thực đặt tên, ID cho form cách: Ấn chuột phải vào form, chọn Properties Thiết lập thuộc tính (Name) Text cho form Thuộc tính (Name) coi ID form để gọi đến form Thuộc tính Text để hiển thị tên form  Bước 2: Đưa Active X vào Visual Studio cách: Tại công cụ chọn TOOL  Choose Toolbox Item  COM components  đánh dấu tích vào Map Control  OK Sau add xong, kiểm tra mục Tool box form thấy control Map Control:  Bước 3: Đưa Map Control vào form cách: kéo chức Map Control từ Toolbox thả vào form, form khung có toạ độ hình: 44 Hình 3.3: Kéo thả Map Control vào form Đặt (Name) cho Map Control vừa kéo vào AxMap1  Bước 4: tạo Legend : Mục đích tạo điều khiển lớp layer (cho phép layer hiển thị, nằm trên) Các bước thực hiện: -Bước 4.1: Tại Tool  Choose Toolbox Item, Net Framework Component  Brower đến C:\Program Files\MapWindow  chọn MapWinInterfaces.dll, tick chọn Legend Sau tick chọn xong, control Legned add vào Toolbox: -Bước 4.2: Kéo Legend từ Toolbox thả vào phía bên trái form Thiết lập thuộc tính (Name) Legend 45 Hình 3.4: Kéo Legend vào form Tạo liên kết Legend Mapcontrol: Chuyển sang hình code form, viết kiện load cho form sau: private void TestMap_Load(System.Object sender, System.EventArgs e) { Legend.Map = AxMap.GetOcx(); }  Bước 5: Thêm chức Tạo layer Xoá layer -Bước 5.1: Tạo Layer Thêm button vào form, đặt thuộc tính Text Tạo layer Viết kiện Click cho button Tạo layer sau: 46 private void BtAdd_Click(object sender, EventArgs e) { int handle = 0; MapWinGIS.Shapefile sf = new MapWinGIS.Shapefile(); OpenFileDialog open1 = new OpenFileDialog(); open1.Filter = sf.CdlgFilter; if (open1.ShowDialog(this) == System.Windows.Forms.DialogResult.OK) { sf.Open(open1.FileName); handle = Legend.Layers.Add(sf, true); Legend.Map.LayerName(handle) = System.IO.Path.GetFileNameWithoutExtension(sf.Filename); } } -Bước 5.2: Xoá Layer Thêm button vào form, đặt thuộc tính Text Xoá layer, Name BtDel Viết kiện Click cho button Xoá layer sau: private void BtDel_Click(object sender, EventArgs e) { AxMap.RemoveAllLayers(); Legend.Layers.Clear(); }  Bước 6: Chọn màu cho vùng hiển thị Thêm button vào form, đặt thuộc tính Text Set Color, Name Bttcolour Từ toolbox, kéo control ColorDialog vào cạnh button Set Color Viết kiện click cho button Set Color sau: 47 private void BttColour_Click(object sender, EventArgs e) { int hnd = 0; System.UInt32 col = 0; hnd = Legend.SelectedLayer; if (ColorDialog1.ShowDialog == System.Windows.Forms.DialogResult.OK) { Col = System.Convert.ToUInt32(Information.RGB(ColorDialog1.Color.R, ColorDialog1.Color.G, ColorDialog1.Color.B)); AxMap.set_ShapeLayerFillColor(hnd, col); Legend.Refresh(); AxMap.Refresh(); } }  Bước 7: Tạo bảng hiển thị liệu layer add vào form -Bước 7.1: Tạo bảng: Tạo window form project cách: Bấm chuột phải vào tên project, chọn Add, chọnWindow form…; Đặt tên file Table.cs Tạo thêm Data grid vào form: Từ tool box, kéo control DatagridView vào form, đặt Name cho control DataGridView1, set thuộc tính dock DataGridView1 Fill 48 Hình 3.5: Kéo thêm DataGridView vào form Table Chuyển sang hình code form Table, thêm dòng khai báo Shape file vào sau dòng Public class Table: MapWinGIS.Shapefile pshape = default(MapWinGIS.Shapefile); Tạo sub với tham số myShapeFile As MapWinGIS.Shapefile cách thêm đoạn code phía vào public Class Table public New(ref MapWinGIS.Shapefile myShapeFile) { pshape = myShapeFile; InitializeComponent(); } Viết kiện load cho form Table sau: 49 private void Table_Load(object sender, EventArgs e) { DataTable myDataTable = new DataTable(); DataRow myDataRow = null; int i = 0; int j = 0; int k = 0; for (i = 0; i [...]... 2.3 Thuật toán lan truyền AP với tập dữ liệu hỗn hợp kiểu số và kiểu phân loại Thuật toán lan truyền là một phương pháp phân cụm dựa trên mẫu, đã chứng minh hiệu suất tốt trên nhiều loại bộ dữ liệu Tuy nhiên, nó có những hạn chế khi xử lý các bộ dữ liệu hỗn hợp Một thước đo độ tương tự mới được đề xuất cho bộ dữ liệu hỗn hợp và một thuật toán phân cụm lan truyền thích ứng để phân cụm dữ liệu hỗn hợp... đường và miền, còn các ký hiệu, nhãn thể hiện các thông tin về thuộc tính của sự vật đó 1.2 Phân cụm dữ liệu địa lý 1.2.1 Phân cụm dữ liệu Phân cụm dữ liệu là một kỹ thuật trong khai phá dữ liệu nhằm tìm kiếm, phát hiện các cụm, các mẫu dữ liệu tự nhiên tiềm ẩn và quan trọng trong tập dữ liệu lớn để từ đó cung cấp thông tin, tri thức cho việc ra quyết định Phân cụm dữ liệu là sự phân chia một cơ sở dữ liệu. .. Cách tiếp cận mờ, trong bài toán phân cụm những loại dữ liệu này tỏ ra là lựa chọn tự nhiên và phù hợp nhất Đã có một số nghiên cứu phân cụm mờ cho dữ liệu địa lý với các kết quả khả quan 19 CHƯƠNG 2 PHÂN CỤM BẰNG THUẬT TOÁN LAN TRUYỀN ĐỘ TƯƠNG TỰ 2.1 Các khái niệm cơ sở 2.1.1 Ý tưởng thuật toán Thuật toán lan truyền độ tương tự (Affinity Propagation - AP) là thuật toán phân cụm dữ liệu được đưa ra... thành các nhóm dữ liệu mà trong đó các đối tượng là tương tự nhau Phân cụm dữ liệu là quá trình tổ chức các đối tượng thành từng nhóm mà các đối tượng ở mỗi nhóm đều tương tự nhau theo một tính chất nào đó, những đối tượng không tương tự tính chất sẽ ở nhóm khác.” Dữ liệu địa lý là dữ liệu bao gồm dữ liệu không gian và dữ liệu thuộc tính được kết hợp với nhau một cách tương ứng Dữ liệu địa lý có thể... đĩa cứng Phần mềm Tuỳ vào nhu cầu sử dụng và tuỳ vào từng sản phẩm mà các phần mềm có thể khác nhau Tuy nhiên, các thành phần chính của các phần mềm GIS gồm có :  Nhập và tìm kiếm dữ liệu  Lưu trữ và quản lý cơ sở dữ liệu  Xuất dữ liệu  Chỉnh sửa dữ liệu  Tương tác với người sử dụng Dữ liệu Có thể coi dữ liệu là thành phần quan trọng nhất của mọi hệ thống cơ sở dữ liệu cũng như hệ thống GIS Dữ liệu. .. đất, các cơ sở dữ liệu ảnh bề mặt trái đất 10 Dữ liệu địa lý ngày một phát triển với lượng dữ liệu ngày càng lớn và phức tạp hơn, đòi hỏi các nhà nghiên cứu cần có những phương pháp, kỹ thuật để phân tích và khai phá dữ liệu hiệu quả hơn Trong những năm gần đây, việc nghiên cứu và khai phá dữ liệu đã có xu hướng chuyển từ cơ sở dữ liệu quan hệ và cơ sở dữ liệu giao dịch sang cơ sở dữ liệu không gian... 2: Phương pháp lan truyền độ tương tự trong phân cụm dữ liệu Trình bày tổng quan một số phương pháp Chương 3: Xây dựng chương trình thử nghiệm Giới thiệu bài toán thử nghiệm Dữ liệu thử nghiệm Thiết kế hệ thống Viết chương trình thử nghiệm Dự định sử dụng ngôn ngữ lập trình C# để xây dựng chương trình demo Kết luận và hướng phát triển của luận văn 4 CHƯƠNG 1 HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ PHÂN CỤM DỮ LIỆU... hình mẫu tốt (phân cụm tương ứng) Thuật toán phân cụm AP có một số ưu điểm: cho kết quả phân cụm tốt, đặc biệt là trong trường hợp có số lượng lớn các cụm, phát hiện cụm có hình dáng bất kỳ, không yêu cầu phải xác định trước số cụm Hình dưới đây minh họa ý tưởng lan truyền độ tương tự trong đồ thị factor Đồ thị gồm có N nút (đỉnh) biến và N nút hàm Mỗi điểm dữ liệu i ứng với một nút biến ci trong đồ thị... quản lý dữ liệu địa lý 1.3.2 Các vấn đề trong phân cụm dữ liệu địa lý Phân cụm dữ liệu địa lý có nhiều ứng dụng trong lĩnh vực khai phá dữ liệu, trích xuất thông tin và tri thức cần thiết để giải quyết nhiều bài toán ứng dụng trong kinh tế, xã hội Bài toán phân cụm dữ liệu địa lý có một số đặc thù riêng cần xem xét -Các đối tượng vùng là các đa giác Phân cụm các đa giác (các vùng địa lý ) có hai cách... thức từ dữ liệu không gian có thể được thực hiện dưới nhiều hình thức khác nhau như sử dụng các quy tắc đặc trưng và quyết định, trích rút và mô tả các cấu trúc hoặc cụm nổi bật, kết hợp không gian Ứng dụng của phân cụm dữ liệu địa lý Phân cụm dữ liệu địa lý được ứng dụng trong nhiều lĩnh vực khác nhau:  Y tế: Xác định và khoanh vùng các ổ dịch giúp cho việc điều trị, quản lý, phòng chống lây lan sang

Ngày đăng: 19/05/2016, 16:33

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan