Nhận dạng văn bản một số ngôn ngữ La Tinh

7 514 0
Nhận dạng văn bản một số ngôn ngữ La Tinh

Đang tải... (xem toàn văn)

Thông tin tài liệu

Nhận dạng là một lý thuyết toán học có nhiều ứng dụng trong thực tiễn, như nhận dạng tiếng nói, nhận dạng hình ảnh, nhận dạng chữ ký, phân loại ngôn ngữ , xây dựng tiêu chuẩn bản rõ ứng dụng trong phân tích các bản mã v.v..Trên thế giới cũng như trong nước đã có nhiều nhà nghiên cứu vấn đề này và đã có những phần mềm áp dụng cho nhiều lĩnh vực khác nhau: phần mềm nhận dạng tiếng việt, phần mềm nhận dạng vân tay, phần mềm kiểm soát Email trên hệ thống Internet…

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ TÊN ĐỀ TÀI NHẬN DẠNG VĂN BẢN MỘT SỐ NGÔN NGỮ LA TINH Giáo viên hướng dẫn : TS Hồ Văn Canh Học viên thực : Lê Mạnh Đoan Lớp : CK14H Thái Nguyên, tháng năm 2016 LỜI CẢM ƠN Trước hết cho phép em chân thành cảm ơn Thầy giáo, Cô giáo khoa Công nghệ thông tin cán bộ, nhân viên phòng Đào tạo Sau đại học, Trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên nhiệt tình giúp đỡ tạo điều kiện tốt cho em suốt trình học tập trường Xin chân thành cảm ơn anh, chị bạn học viên lớp Cao học CK14H - Trường Đại học Công nghệ Thông tin Truyền thông – Đại học Thái Nguyên động viên, giúp đỡ nhiệt tình chia sẻ với em kinh nghiệm học tập, công tác suốt khoá học Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến TS Hồ Văn Canh, người tận tình giúp đỡ em hình thành hoàn chỉnh luận văn Mặc dù có nhiều cố gắng, song hạn hẹp thời gian, điều kiện nghiên cứu trình độ, luận văn không tránh khỏi khiếm khuyết Em chân thành mong nhận đóng góp ý kiến Thầy giáo, Cô giáo đồng nghiệp Một lần em xin cảm ơn! Thái Nguyên, tháng 05 năm 2016 Người thực luận văn Lê Mạnh Đoan ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ Tên đề tài:“Nhận dạng văn số ngôn ngữ La tinh” Giáo viên hướng dẫn: TS Hồ Văn Canh Học viên thực hiện: Lê Mạnh Đoan Lớp: CK14H Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông/Đại học Thái Nguyên Chuyên ngành: Khoa học máy tínhsố chuyên ngành: 60 48 01 Đặt vấn đề 1.1 Sự cần thiết lựa chọn đề tài Nhận dạng lý thuyết toán học có nhiều ứng dụng thực tiễn, nhận dạng tiếng nói, nhận dạng hình ảnh, nhận dạng chữ ký, phân loại ngôn ngữ , xây dựng tiêu chuẩn rõ ứng dụng phân tích mã v.v Trên giới nước có nhiều nhà nghiên cứu vấn đề có phần mềm áp dụng cho nhiều lĩnh vực khác nhau: phần mềm nhận dạng tiếng việt, phần mềm nhận dạng vân tay, phần mềm kiểm soát E-mail hệ thống Internet… Nhận dạng chữ toán hữu ích, quen thuộc ứng dụng nhiều thực tế đặc biệt lĩnh vực nhận dạng phân loại văn thu hút nhiều tác giả quan tâm nghiên cứu phương pháp nhận dạng khác nhau: logic mờ, giải thuật di truyền, mô hình xác suất thống kê, mô hình mạng nơ ron Đã có nhiều công trình nghiên cứu thực việc nhận dạng, phân loại văn La Tinh đạt tỷ lệ xác cao, nhiên ứng dụng chưa thể đáp ứng hoàn toàn nhu cầu người sử dụng nên ngày người ta tiếp tục nghiên cứu phương pháp nhận dạng tốt hướng đến dùng cho thiết bị di động, toán thời gian thực Sau tìm hiểu tiến công nghệ nhận dạng chữ La Tinh tính phần mềm nhận dạng chữ, tư vấn giáo viên hướng dẫn, lựa chọn hướng nghiên cứu thiết thực với đề tài: "Nhận dạng văn số ngôn ngữ La tinh" Trong khuôn khổ luận văn, tập trung nghiên cứu, giải toán nhận dạng ngôn ngữ tự nhiên dựa vào phân hoạch không gian (nhận dạng theo thống kê toán học), lớp ngôn ngữ tiêu biểu nghiên cứu ngôn ngữ La Tinh tiếng Anh, tiếng Pháp, v.v 1.2 Mục tiêu nghiên cứu đề tài - Nghiên cứu xây dựng chương trình nhận dạng văn ứng với ngôn ngữ tự nhiên : Tiếng Anh, Tiếng Pháp, Tiếng Đức, Tiếng Tây Ban Nha Đối tượng phạm vi nghiên cứu 2.1 Đối tượng - Ngôn ngữ tự nhiên đối tượng nghiên cứu đề tài 2.2 Phạm vi nghiên cứu - Tìm hiểu tổng quan nhận dạng; - Tìm hiểu đặc trưng ngôn ngữ La tinh - Xây dựng, cài đặt số kỹ thuật nhận dạng ngôn ngữ La tinh 3.3 Hướng nghiên cứu đề tài - Nghiên cứu trình Markov hữu hạn trạng thái - Nghiên cứu xây dựng mô hình Markov ứng với ngôn ngữ tự nhiên : Tiếng Anh, Tiếng Pháp, Tiếng Đức, Tiếng Tây Ban Nha Cấu trúc luận văn Dự kiến luận văn gồm: Phần mở đầu, ba chương chính, kết luận tài liệu tham khảo cụ thể: Phần mở đầu: Nêu lý chọn đề tài bố cục luận văn Chương 1: TỔNG QUAN VỀ NHẬN DẠNG Chương trình bày tổng quan hướng nghiên cứu nhận dạng Chương 2: TÌM HIỂU KỸ THUẬT NHẬN DẠNG BẰNG THỐNG KÊ Chương trình bày ứng dụng kỹ thuật thống kê Toán học để nhận dạng ngôn ngữ tự nhiên tìm hiểu đặc trưng số ngôn ngữ tự nhiên tiêu biểu Chương 3: THỰC NGHIỆM Nội dung phần trình bày thuật toán nhận dạng văn La Tinh đưa kết với số mẫu ngắn ngôn ngữ cho trước Phần kết luận: Nhận xét, kết luận hướng phát triển Phương pháp nghiên cứu - Tìm hiểu cập nhật kiến thức phương pháp nhận dạng ngôn ngữ tự nhiên, trí tuệ nhân tạo, khảo sát lý thuyết mô hình, công cụ toán học, thiết kế xây dựng thuật toán, kỹ thuật tổ chức liệu ngôn ngữ lập trình - Tìm hiểu xây dựng đặc trưng ngôn ngữ mà đề tài quan tâm - Tìm đọc báo, công trình nghiên cứu khoa học liên quan đến chủ đề nghiên cứu nước giới Cụ thể tài liệu kỹ thuật thống kê toán học trình Markov; quy luật ngôn ngữ trình ngẫu nhiên dừng, không hậu quả; kỹ thuật nhận dạng ngôn ngữ tự nhiên Hình thành tổng quan tương đối đầy đủ tình hình nghiên cứu liên quan đến chủ đề giới - Lập trình cài đặt số kỹ thuật nhận dạng ngôn ngữ La Tinh đánh giá kết Ý Nghĩa khoa học đề tài - Kết nghiên cứu, tìm hiểu đề tài góp phần nhận dạng loại ngôn ngữ tự nhiên, có khả mở rộng ứng dụng việc xây dựng chương trình kiểm soát E-mail đặc biệt chương trình phân tích mã tự động Vấn đề công nghệ mà phương pháp nhận dạng ngôn ngữ tự nhiên khả ứng dụng cao thực tiễn, đặc biệt ANQP xí nghiệp vừa nhỏ có nhu cầu nhận dạng loại ngôn ngữ tự nhiên Đó ý nghĩa khoa học thực tiễn đề tài luận văn Dự kiến kế hoạch đề tài Trên sở kế hoạch Trường Đại học Công nghệ Thông tin Truyền Thông/Đại học Thái Nguyên gửi tới học viên, em dự kiến kế hoạch hoàn thành luận văn sau: T T Thời gian 2016 10 11 12 X X Chuẩn bị đề tài, đăng ký đề tài X nghiên cứu Chuẩn bị đề cương, nộp bảo X X vệ đề cương Tìm hiểu tổng quan nhận X X dạng - Hoàn thành tìm hiểu tổng quan nhận dạng X X - Báo cáo tiến độ lần - Tìm hiểu đặc trưng loại ngôn ngữ tự nhiên - Báo cáo tiến độ lần Hoàn thành cài đặt thử nghiệm - Hoàn chỉnh viết báo cáo toàn văn - Nộp luận văn X X 2017 X Chỉnh sửa, hoàn chỉnh nộp Tài liệu tham khảo [1] Nguyễn Viết Thế, Hồ Văn Canh ( 2010), Nhập môn Phân tích thông tin có bảo mật, NXB Thông tin Truyền thông [2] Hồ Văn Canh, Phạm Quốc Doanh (2002), Thuật toán nhận dạng ngôn ngữ tự nhiên, tr 3-20 [3] Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), Nhập môn xử lý ảnh số, Nhà xuất khoa học kỹ thuật, tr.154-170 X - Hoàn chỉnh báo cáo, làm slide - Bảo vệ luận văn X X [4] Trần Duy Hưng, Nguyễn Ngọc Cường (2002), Nhận dạng tự động ngôn ngữ tiếng Anh, Tạp chí "Tin học điều khiển học", Trung tâm Khoa học tự nhiên Công nghệ Quốc gia số 3/2002 [5] Hoàng Minh Tuấn, Một số vấn đề xây dựng siêu máy tính chi phí thay cho ứng dụng xử lý thông tin tính toán khoa học kỹ thuật, Luận văn Tiến sĩ kỹ thuật, Mã số 62.52.70.01 tr 35-55 [6] AndrewR.Web.2002 John Wiley & Sons, Ltd Statistical Pattern Recognition, Second Edition [7] Richard O Duda, Peter E Hart, David G Stork Wiley-interscience “Bayesian decision theory”, Pattern Classification, Second Edition: 39-78 [8] Wilks, S S 1962 Mathematical Statitics New York: John Wiley Mark Stam, Richar M.Low ( 2007 ): Applied Cryptanalysis Breaking ciphers in the Real World A John wiley & sons, Inc, publication 2007 Chứng nhận giáo viên hướng dẫn Hồ Văn Canh Học viên Lê Mạnh Đoan ... thực với đề tài: "Nhận dạng văn số ngôn ngữ La tinh" Trong khuôn khổ luận văn, tập trung nghiên cứu, giải toán nhận dạng ngôn ngữ tự nhiên dựa vào phân hoạch không gian (nhận dạng theo thống kê... Ngôn ngữ tự nhiên đối tượng nghiên cứu đề tài 2.2 Phạm vi nghiên cứu - Tìm hiểu tổng quan nhận dạng; - Tìm hiểu đặc trưng ngôn ngữ La tinh - Xây dựng, cài đặt số kỹ thuật nhận dạng ngôn ngữ La. .. toán học), lớp ngôn ngữ tiêu biểu nghiên cứu ngôn ngữ La Tinh tiếng Anh, tiếng Pháp, v.v 1.2 Mục tiêu nghiên cứu đề tài - Nghiên cứu xây dựng chương trình nhận dạng văn ứng với ngôn ngữ tự nhiên

Ngày đăng: 30/04/2017, 15:51

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN

Tài liệu cùng người dùng

Tài liệu liên quan