Ứng dụng mạng nơron trong bài toán nhận dạng ký tự

64 569 1
Ứng dụng mạng nơron trong bài toán nhận dạng ký tự

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Trước hết, em xin chân thành cảm ơn quý thầy cô trường Đại học Công Nghệ Thông Tin Và Truyền Thông, đặc biệt thầy cô khoa Công Nghệ Thông Tin tận tình dạy dỗ, truyền đạt cho chúng em nhiều kiến thức quý báu Em xin gửi lời biết ơn sâu sắc đến thầy ThS Lê Anh Tú dành nhiều thời gian tâm huyết để hướng dẫn nghiên cứu giúp đỡ em hoàn thành đồ án Thầy mở cho em vấn đề khoa học lý thú, hướng em vào nghiên cứu lĩnh vực thiết thực bổ ích, đồng thời tạo điều kiện thuận lợi cho em học tập nghiên cứu Xin chân thành cảm ơn bạn lớp, Trường Đại Học Công Nghệ Thông Tin Và Truyền Thông giúp đỡ, động viên nhiều trình thực đồ án Mặc dù có nhiều cố gắng hoàn thiện lực nhiệt tình mình, nhiên không tránh khỏi thiếu sót Em mong góp ý thầy cô bạn Em xin chân thành cảm ơn! Thái Nguyên, tháng 06 năm 2012 Sinh viên CHU VĂN NGỌC LỜI CAM ĐOAN Em xin cam đoan nội dung đồ án không chép nội dung từ đồ án khác, sản phẩm đồ án thân nghiên cứu xây dựng nên Thái Nguyên, tháng 06 năm 2012 Người cam đoan CHU VĂN NGỌC MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC HÌNH ẢNH LỜI NÓI ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NORON NHÂN TẠO 1.1 Lịch sử phát triển mạng noron 1.2 Tổng quan mạng nơron .9 1.2.1 Nơron sinh học 1.2.2 Noron nhân tạo 10 1.3 Mạng nơron nhân tạo .13 1.3.1 Định nghĩa mạng nơron nhân tạo .13 1.3.2 Mô hình mạng nơron nhân tạo 13 1.3.3 Các thuật toán học .19 1.3.3.2 Thuật toán huấn luyện mạng 20 1.4 Thuật toán lan truyền ngược Giải thuật Back propagation minh họa 25 1.4.1 Thuật toán lan truyền ngược .25 1.4.2 Giải thuật Back propagation minh họa .26 1.4.3 Một số vấn đề gặp phải sử dụng mạng Back Perceptoron 36 CHƯƠNG : 39 ỨNG DỤNG MẠNG NƠRON TRONG BÀI TOÁN 39 NHẬN DẠNG KÍ TỰ 39 2.1 Mô tả toán 39 2.2 Hướng phát triển toán .39 2.3 Trình tự bước giải giải toán 40 2.3.1 Ảnh đầu vào 40 2.3.2 Tách dòng kí tự 40 2.3.3 Tách kí tự 41 2.3.4 Tìm giới hạn kí tự .42 2.3.5 Ánh xạ vào ma trận .44 2.3.6 Thiết kế mạng noron 45 2.3.7 Huấn luyện mạng noron .46 2.3.8 Nhận dạng ảnh kí tự 49 2.3.9 Bảng mã ASCII sử dụng cho chương trình 50 CHƯƠNG 3: 52 CHƯƠNG TRÌNH THỬ NGHIỆM .52 3.1 Môi trường thực nghiệm 52 3.2 Giao diện chương trình 52 3.4 Thực nghiệm 53 3.4.1 Thực nghiệm trình tính giá trị số tham số đầu vào .53 3.4.2 Thực nghiệm huấn luyện mạng 55 3.4.3 Thực nghiệm nhận dạng .58 KẾT LUẬN .62 TÀI LIỆU THAM KHẢO 63 DANH MỤC HÌNH ẢNH Hình 1.1: Mô hình noron sinh học Hình 1.2: Một noron nhân tạo .10 Hình 1.3: Một số hàm truyền thông dụng 12 Hình 1.4: Mạng noron nhân tạo đơn giản .14 Hình 1.5: Mạng truyền thẳng với mức nơron 15 Hình 1.6: Mạng dẫn tiến kết nối đầy đủ với mức ẩn mức đầu ra16 Hình 1.8: Mạng phản hồi có nơron ẩn 18 Hình 1.9: Minh họa giải thuật Back Propagation 27 Hình 1.10: Các thành phần noron nhân tạo 27 Hình 1.11: Minh họa giải thuật Back Propagation 28 Hình 1.12: Quá trình lan truyền tiến .29 Hình 1.13: Tính giá trị lỗi đầu .31 Hình 1.14: Lan truyền ngược 31 Hình 1.15: Lan truyền ngược 31 Hình 1.16: Lan truyền ngược lớp 32 Hình 1.17: Lan truyền ngược 33 Hình 1.18: Lan truyền ngược vòng .34 Hình 1.19: Nội suy hàm y = sin(x/3) + v, 0≤ x ≤ 20 37 Hình 2.1: Quá trình tách dòng kí tự .41 Hình 2.2: Quá trình tách kí tự .42 Hình 2.3: Quá trình tìm giới hạn kí tự 43 Hình 2.4: Sơ đồ mạng nơron thiết kế .45 Hình 2.5: Sơ đồ khối trình huấn luyện mạng nơron .48 Hình 2.6: Sơ đồ khối trình nhận dạng kí tự 49 52 Hình 3.1: Giao diện chương trình thực nghiệm 52 Hình 3.2: Ảnh đầu dùng để huấn luyện 56 Hình 3.3: File đầu mong muốn .56 Hình 3.4 a : chữ “o_ hoa” Hình 3.4b : chữ “o_thường” 58 Hình 3.5a : Ảnh kích cỡ cua font Arial 58 Hình 3.5b : Kết thu font Arial 59 Hình 3.6a : Ảnh vào font Times New Roman 59 Hình 3.6b : Kết thu font Times New Roman 59 Hình 3.7a : Kết thu font Tahoma 60 Hình 3.7b: Kết thu font Tahoma .60 LỜI NÓI ĐẦU Sự phát triển mạnh mẽ công nghệ nói chung công nghệ thông tin nói riêng tạo nên nhiều hệ thống thông tin phục vụ việc tự động hoá Điều tạo dòng liệu khổng lồ Phát tri thức sở liệu (Knowledge Discovery in Databases - KDD) trình hợp liệu từ nhiều hệ thống liệu khác tạo thành kho liệu, phân tích thông tin để có nhiều tri thức tiềm ẩn có giá trị Khai phá liệu lĩnh vực nghiên cứu khoa học máy tính phát triển mạnh mẽ Nó kết hợp học máy, công nghệ sở liệu số chuyên ngành khác để tìm tri thức từ sở liệu lớn Trong công nghệ khai phá liệu (Data mining) mạng noron nhân tạo hướng tiếp cận đánh giá cao Hướng tiếp cận có hàm lượng khoa học lớn ứng dụng thực tiễn để giải nhiều lớp toán khác Trong báo cáo Em sâu tìm hiểu mạng noron nhân tạo lan truyền ngược Back Perceptoron Đây mô hình mạng noron điển hình nghiên cứu triển khai rộng rãi nhiều lĩnh vực Nội dung báo cáo tổ chức thành chương có nội dung sau: - Chương 1: Tổng quan Mạng Noron nhân tạo - Chương 2: Ứng dụng mạng noron nhân tạo toán nhận dạng kí tự - Chương 3: Chương trình thử nghiệm CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NORON NHÂN TẠO 1.1 Lịch sử phát triển mạng noron Sự kiện đánh dấu đời mạng noron nhân tạo diễn vào năm 1943 nhà thần kinh học Warren McCulloch nhà toán học Walter Pitts viết báo mô tả cách thức noron hoạt động Họ tiến hành xây dựng mạng noron đơn giản mạch điện Các noron họ xem thiết bị nhị phân với ngưỡng cố định Kết mô hình hàm logic đơn giản Những tiến máy tính đầu năm 1950 giúp cho việc mô hình hóa nguyên lý lý thuyết liên quan tới cách thức người suy nghĩ trở thành thực Nathanial Rochester sau nhiều năm làm việc phòng thí nghiệm nghiên cứu IBM có nỗ lực để mô mạng noron Năm 1956 dự án Dartmouth nghiên cứu trí tuệ nhân tạo (Artificial Intelligence) mở thời kỳ phát triển lĩnh vực trí tuệ nhân tạo lẫn mạng noron Từ năm sau tới năm 1985 xuất thêm nhiều phát minh mô hình mạng noron nhân tạo khác Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức họp hàng năm mạng noron ứng dụng tin học (Neural Networks for Computing) Năm 1987, hội thảo quốc tế mạng noron Viện kỹ sư điện điện tử IEEE (Institute of Electrical and Electronic Engineer) thu hút 1800 người tham gia Ngày nay, không dừng lại mức nghiên cứu lý thuyết, nghiên cứu ứng dụng mạng noron để giải toán thực tế diễn khắp nơi Các ứng dụng mạng noron đời ngày nhiều ngày hoàn thiện Điển hình ứng dụng: xử lý ngôn ngữ, nhận dạng kí tự nhận dạng tiếng nói (Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu (Signal Processing), Lọc liệu (Data Filtering),… 1.2 Tổng quan mạng nơron 1.2.1 Nơron sinh học Bộ não người bao gồm khoảng 1011 noron tham gia vào khoảng 1015 kết nối đường truyền Các noron có khả nhận, xử lý truyền tín hiệu điện hóa dây thần kinh Một số cấu trúc noron xác định trước lúc sinh Một số cấu trúc phát triển thông qua trình học Như noron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu vào, xử lý tín hiệu cho tín hiệu output Tín hiệu output sau truyền làm tín hiệu đầu vào cho noron khác Dựa hiểu biết noron sinh học, người xây dựng noron nhân tạo với hy vọng tạo nên mô hình có sức mạnh não Hình 1.1: Mô hình noron sinh học Phần tử xử lý mạng nơron sinh học nơron, phần tử chia làm bốn thành phần sau: dendrites, soma, axon, synaptic - Dendrites phần nhận tín hiệu đầu vào - Soma: hạt nhân - Axon: phần dẫn tín hiệu xử lý Synaptic: đường tín hiệu điện hóa giao tiếp nơron.Kiến trúc sở não người có vài đặc tính chung Một cách tổng quát, nơron sinh học nhận đầu vào từ nguồn khác nhau, kết hợp chúng với nhau, thực thi tổ hợp phi tuyến chúng kết cuối đầu Hình 1.1 mối quan hệ bốn phần tử nơron sinh học 1.2.2 Noron nhân tạo Một noron đơn vị xử lý thông tin thành phần mạng noron Cấu trúc noron mô tả hình đây: Hình 1.2: Một noron nhân tạo Các thành phần noron nhân tạo bao gồm: - Tập đầu vào: Là tín hiệu vào (input signals) noron, tín hiệu thường đưa vào dạng vector N chiều - Tập liên kết: Mỗi liên kết thể trọng số (gọi trọng số liên kết – Synaptic weight) Trọng số liên kết tín hiệu vào thứ j với noron k thường kí hiệu wkj Thông thường, trọng số khởi tạo cách ngẫu nhiên thời điểm khởi tạo mạng cập nhật liên tục trình học mạng - Bộ tổng (Summing function): Thường dùng để tính tổng tích đầu vào với trọng số liên kết - Ngưỡng (còn gọi độ lệch - bias): Ngưỡng thường đưa vào 10 Thuật toán: Nạp file ảnh Phân tích ảnh cho dòng kí tự Với dòng tách kí tự liên tiếp + Phân tích xử lý ảnh kí tự cho việc ánh xạ vào vectơ đầu vào + Đưa giá trị vecto đầu vào cho mạng neural tính toán giá trị đầu + Chuyển đổi mã Unicode đầu từ nhị phân tới kí tự tương ứng trả dạng textbox 2.3.9 Bảng mã ASCII sử dụng cho chương trình Trong đề tài sử dụng mã Unicode gồm 256 mã mã hóa 16 bit Đây lý mà số neural đầu 16 neural, tương ứng với 16 bit mã Unicode Dưới số mã ASCII sử dụng trình nhận dạng kí tự: 50 51 CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 Môi trường thực nghiệm Phần cứng : Một máy tính Card đồ họa 512 MB Ram GB Phần mềm : Ngôn ngữ sử dụng: C# visual studio 2005 Tập liệu ảnh đa cấp xám với số ký tự đầu vào từ 120 đến 160 ký tự hai loại font: Arial Tahoma với kích thước: 8,14,18,20 3.2 Giao diện chương trình Hình 3.1: Giao diện chương trình thực nghiệm 52 3.4 Thực nghiệm 3.4.1 Thực nghiệm trình tính giá trị số tham số đầu vào a Thực nghiệm tìn số lần lặp lại Quá trình tăng số lần lặp có sinh quan hệ tỷ lệ rõ ràng mạng Tuy nhiên trường hợp cụ thể việc tăng số lần lặp có số hiệu ứng bất lợi nhiều số đưa vào dẫn đến nhận dạng sai Từng phần riêng thuộc tính tham số tốc độ học Nó giới hạn tối ưu mở rộng việc cập nhật kết trọng số trạng thái vòng tối ưu Với việc tăng lặp lặp lại mạng thử lại tới trạng thái mong muốn tiếp tục quay lại Vì cần có số lần lặp tối ưu với lỗi chấp nhận Các giá trị khác số kí tự=124, tốc độ học=150, Sigmoid slope=0.014 Bảng 3.2 : Thực nghiệm tìm số lần lặp 300 Kiểu font Arial Tahoma Time NewRoman Số kí tự lỗi % lỗi 600 Số kí tự 4.44 1.11 lỗi 0 % lỗi 900 Số kí tự 3.33 lỗi 0 % lỗi 1.11 1.11 Giá trị định cho số lần lặp 300 mạng neural có đặc trưng chấp nhận sai xót lại sử dụng số lần lặp lớn với số lượng neural lớn tập huấn luyện lớn ta cần nhiều thời gian cho việc huấn luyện dẫn đến tốn chi phí huấn luyện b Thực nghiệm tìm đầu vào (số kí tự đưa vào) 53 Kích thước trạng thái đầu vào ảnh hưởng tới trình thực thi Nó tự nhiên, nhiều giá trị kí tự đầu vào thiết lập mạng phụ thuộc vào trình huấn luyện dễ bị mắc lỗi Thông thường phức tạp tập hợp đầu vào lớn cần mô hình mạng lớn với nhiều số lần lặp lại Cho tập hợp 120 đến 150 kí tự ta cần có mô hình mạng với lớp ẩn có 500 neural Các giá trị khác số lần lặp=300, tốc độ học=150, Sigmoid slope=0.014 Bảng 3.3 : Thực nghiệm tìm số kí tự 50 Kiểu font Arial Tahoma Time NewRoman Số kí tự lỗi 0 90 % lỗi Số kí tự lỗi 124 % lỗi Số kí tự lỗi 0.044 0.022 0.022 % lỗi 0.048 0.032 0.032 Giá trị định cho số kí tự đưa vào 120 đến 160 với số lượng 50 hay 90 ký tự hết ký tự sử dụng vấn đề lâu dài tập 256 ký tự bảng mã ASCII c Thực nghiệm tìm tham số tốc độ học Sự thay đổi tham số tốc độ học ảnh hưởng tới thi hành mạng cho số lần lặp định sẵn Giảm giá trị tham số này, mạng cập nhật lại trọng số Nó làm giảm khả học khó cập nhật liên kết chậm hơn, tăng số lần lặp để đạt giá trị tối ưu Vì cần giá trị tối ưu cho thi hành mạng Các giá trị khác số kí tự=124, số lần lặp=300, Sigmoid slope=0.014 Theo kết bảng 3.4, giá trị tối ưu định cho tham số tốc độ học 150 sử dụng giá trị 50 hay 100 mạng học lâu độ xác không cao đốI với giá trị khác cho kết tương tự Bảng 3.4: Thực nghiệm tìm tốc độ học 54 50 100 Kiểu font Số kt lỗi Số kt lỗi % lỗi Arial Tahoma Time NewRoman % lỗi 150 Số 82 56 91.11 62.22 18 11 20 12.22 kt lỗi 77 85.56 15 16.67 % lỗi 3.33 1.11 3.4.2 Thực nghiệm huấn luyện mạng Như biết có nhiều yếu tố ảnh hưởng tới trình huấn luyện mạng là: đa dạng đầu vao: kích thước , phong cách… Một điều cần thiết chuẩn bị trình tự ảnh kí tự đầu vào file ảnh đơn giản (*.bmp [bitmap] mở rộng), tương ứng với cac kí tự file văn (*.cts [character trainer set] mở rộng) lưư trữ hai file thư mục (cả hai file tên khác phần mở rộng) Ứng dụng cung cấp cho người dùng hộp thoại lựa chọn đường dẫn tới vị trí file văn *.cts đưa file ảnh tương ứng với Trong đồ án số tham số lựa chọn sau: Tốc độ học = 150 Hệ số góc Sigmoid= 0.014 Trọng số kết nối sở= 30 Số lần lại 300-600 tùy độ phức tạp loại font Trung bình ngưỡng lỗi = 0.0002 Mẫu dùng trình thực nghiệm huấn luyện: Ảnh đầu vào: 55 Hình 3.2: Ảnh đầu dùng để huấn luyện Hình 3.3: File đầu mong muốn Kết huấn luyện: Sau huấn luyện xong lưu lại kết vào thu mục “Mang” với *.ann để mỗI nhận dạng ta đưa giá trị vao mạng neural 56 Bảng : Thống kê kết huấn luyện: Loại font Arial8 Arial10 Arial12 Arial14 Arial18 Arial20 Arial_Số Arial_Hoa Arial_Thường Tahoma Tahoma 10 Tahoma 12 Tahoma 14 Tahoma 18 Tahoma 20 Tahoma_Số Tahoma_Hoa Tahoma_Thường Số kí tự Số kí huấn luyện tự lỗi 124 124 124 124 124 124 160 156 156 124 124 124 124 124 124 160 156 156 2 3 2 0 2 0 0 %lỗi Ghi 0.016 0.016 0.024 0.024 0.013 0.013 0 0.016 0.026 0.016 0.016 0 0 57 Nhận xét trình huấn luyện : Đối vớI font Arial có : Hình 3.4 a : chữ “o_ hoa” Hình 3.4b : chữ “o_thường” Đối với trình huấn luyện ta cần ý nhiều font Arial hình 3.4a hình 3.4b chữ “o_Hoa” chữ “o_Thường ” mã tách kí tự, chia lưới đưa kết vào mạng làm cho mạng không phân biệt hai kí tự dẫn đến sau nhận dạng sai Phương pháp cần tăng số lần lặp cho trình huấn luyện 3.4.3 Thực nghiệm nhận dạng Để thực nhận dạng kí tự tiến hành bước sau:  Đưa giá trị huấn luyện vào mạng  Đưa ảnh cần nhận dạng vào  Ghi lại kết nhận dạng Một số ảnh kết nhận dạng sau thực nhận dạng: Ảnh đầu vào: Hình 3.5a : Ảnh kích cỡ cua font Arial 58 Kết thu ABCDEFGHlJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz 0123456789 ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijkImnopqrstuvwxyz 0123456789 Hình 3.5b : Kết thu font Arial Ảnh đầu vào: Hình 3.6a : Ảnh vào font Times New Roman Kết thu DeTaiTotNghiep Nam 2012 UngDungMangNeuraINhanTaTrongNhanDangkyTu SinhVienThucHienChuVanNgoc Hình 3.6b : Kết thu font Times New Roman 59 Hình 3.7a : Kết thu font Tahoma Kết thu được: Hình 3.7b: Kết thu font Tahoma Nhận xét trình nhận dạng kí tự: Đối với trình huấn luyện ta cần ý nhiều font Arial nói hình 3.4a hình 3.4b chữ “o_Hoa”mã chữ “o_Thường ” mã tách kí tự, chia lưới đưa kết vào mạng làm cho mạng không phân biệt hai kí tự dẫn đến sau nhận dạng sai Phương pháp cần tăng số lần lặp cho trình huấn luyện Ngoài số trường hợp ảnh hai kí tự nằm chéo số trường hợp sau: 60 AYAV Nó dẫn đến trình tách kí tự bị dính dó nhận dạng sai Đối với trường hợp ta cần phát triển phương pháp tách để tách kí tự Trong trình thực nghiệm nhận dạng kí tự ta thấy kí tự sai trình huấn luyện mạng chưa học kí tự ảnh nhận dạng bị nhận dạng sai Có số trình tách kí tự 61 KẾT LUẬN Trong thời gian vừa qua, trình bày nội dung nghiên cứu đề tài em gồm phần sau:  Tìm hiểu mạng nơron nhân tạo  Tìm hiểu toán nhận dạng  Mô tả toán ứng dụng mạng nơron nhận dạng kí tự  Phân tích cụ thể toán nhận dạng  Thiết kế mạng huấn luyện mạng nơron cho toán “ứng dụng mạng nơron nhân tạo nhận dạng kí tự”  Chương trình thử nghiệm Nhận dạng kí tự phần quan trọng lĩnh vực nhận dạng nói riêng xử lý ảnh nói chung Cùng với việc sử dụng công cụ mạng neural lĩnh vực cần phát triển Hướng phát triển đồ án tương lai  Nâng cao hiệu độ xác việc nhận dạng kí tự  Mở rộng cỡ chữ đặc biệt cỡ chữ dùng nhiều văn 62 TÀI LIỆU THAM KHẢO [1.] Đinh Thị Hương Lan, CT603, Trường đại học dân lập hải phòng,Tìm hiểu mạng neural nhân tạo cho toán nhận dạng [2.] Ben Krose, faculty of Mathematics and computer science, university of Amsterdam And Patrick van der smagt, institute of robotics and system dynamics German aerospase Reseach establishment, MathNeuralNetworks [3.] Colin Fyfe, department of computing and information system, the university of Paisley, Artificial Neural Networks and Information theory [4.] Mostefa golea and Mario Marchand, Deparment of physics, university of Ottawa Canada, A Growth Algorithm for Neural Networks Decision Trees [5.] From Wikipedia, the free encyclopedia Artificial neural network [6.] http://en.wikipedia.org/wiki/Non-linear [7.] Ngô Xuân Bách, ứng dụng mô hình mạng noron nhận dạng chữ viết tay rời rạc hạn chế trực tuyến table pc, khóa luận tốt nghiệp ngành CNTT ĐH Công nghệ [8.] R.Rojas, Perception Learning, neural networks, Berlin, 1996 63 ... thuyết, nghiên cứu ứng dụng mạng noron để giải toán thực tế diễn khắp nơi Các ứng dụng mạng noron đời ngày nhiều ngày hoàn thiện Điển hình ứng dụng: xử lý ngôn ngữ, nhận dạng kí tự nhận dạng tiếng nói... quan Mạng Noron nhân tạo - Chương 2: Ứng dụng mạng noron nhân tạo toán nhận dạng kí tự - Chương 3: Chương trình thử nghiệm CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NORON NHÂN TẠO 1.1 Lịch sử phát triển mạng. .. tiếp Một mạng nơron có cấu trúc gọi mạng hướng hay mạng 14 truyền thẳng hướng (Feed forward network), có cấu trúc mạng ghép nối hoàn toàn (vì nơron mạng nối với vài nơron khác) Mạng nơron bao

Ngày đăng: 20/04/2017, 22:16

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN

  • LỜI CAM ĐOAN

  • Em xin cam đoan về nội dung đồ án không sao chép nội dung cơ bản từ các đồ án khác, và sản phẩm của đồ án là của chính bản thân nghiên cứu và xây dựng nên.

  • Người cam đoan

  • CHU VĂN NGỌC

  • DANH MỤC HÌNH ẢNH

  • LỜI NÓI ĐẦU

  • Sự phát triển mạnh mẽ của công nghệ nói chung và công nghệ thông tin nói riêng đã tạo nên nhiều hệ thống thông tin phục vụ việc tự động hoá. Điều này đã tạo ra những dòng dữ liệu khổng lồ. Phát hiện tri thức trong cơ sở dữ liệu (Knowledge Discovery in Databases - KDD) là một quá trình hợp nhất các dữ liệu từ nhiều hệ thống dữ liệu khác nhau tạo thành các kho dữ liệu, phân tích thông tin để có được nhiều tri thức tiềm ẩn có giá trị. Khai phá dữ liệu là một trong những lĩnh vực nghiên cứu của khoa học máy tính hiện nay đang được phát triển rất mạnh mẽ. Nó kết hợp giữa học máy, công nghệ cơ sở dữ liệu và một số chuyên ngành khác để tìm ra những tri thức từ những cơ sở dữ liệu lớn.

  • Trong công nghệ khai phá dữ liệu (Data mining) thì mạng noron nhân tạo là một hướng tiếp cận được đánh giá cao. Hướng tiếp cận này có hàm lượng khoa học lớn và có thể ứng dụng trong thực tiễn để giải quyết nhiều lớp bài toán khác nhau.

  • Trong bài báo cáo này Em sẽ đi sâu tìm hiểu về mạng noron nhân tạo lan truyền ngược Back Perceptoron. Đây là một mô hình mạng noron điển hình đã được nghiên cứu và triển khai rộng rãi trong nhiều lĩnh vực.

  • Nội dung chính của bài báo cáo được tổ chức thành 3 chương có nội dung như sau:

  • CHƯƠNG 1:

  • TỔNG QUAN VỀ MẠNG NORON NHÂN TẠO

    • 1.1. Lịch sử phát triển mạng noron

    • Sự kiện đầu tiên đánh dấu sự ra đời của mạng noron nhân tạo diễn ra vào năm 1943 khi nhà thần kinh học Warren McCulloch và nhà toán học Walter Pitts viết bài báo mô tả cách thức các noron hoạt động. Họ cũng đã tiến hành xây dựng một mạng noron đơn giản bằng các mạch điện. Các noron của họ được xem như là các thiết bị nhị phân với ngưỡng cố định. Kết quả của các mô hình này là các hàm logic đơn giản.

    • Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng noron.

    • Năm 1956 dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng noron.

    • Từ những năm sau đó tới năm 1985 đã xuất hiện thêm nhiều phát minh ra các mô hình mạng noron nhân tạo khác nhau.

    • Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng năm về mạng noron ứng dụng trong tin học (Neural Networks for Computing).

    • Năm 1987, hội thảo quốc tế đầu tiên về mạng noron của Viện các kỹ sư điện và điện tử IEEE (Institute of Electrical and Electronic Engineer) đã thu hút hơn 1800 người tham gia.

Tài liệu cùng người dùng

Tài liệu liên quan