BÁO CÁO THỰC TẬP TỐT NGHIỆP : Nghiên cứu nhận dạng chữ số viết tay sử dụng logic mờ

62 685 0
BÁO CÁO THỰC TẬP TỐT NGHIỆP : Nghiên cứu nhận dạng chữ số viết tay sử dụng logic mờ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC: Chương 1: Cơ sở lý thuyết 6 1.1 Tổng quan về hệ thống nhận dạng 6 1.1.1 Đối tượng nhận dạng 6 1.1.2 Mô hình hóa bài toán nhận dạng 7 1.1.3 Các vấn đề cơ bản của hệ thống nhận dạng 8 1.1.3.1 Mô hình hóa đối tượng thu nhận (trích chọn đặc trưng) 8 1.1.3.2 Mô hình tham số 9 1.1.3.3 Mô hình cấu trúc 9 1.1.3.4 Quá trình học 9 1.1.3.5 Quá trình ra quyết định (hàm quyết định) 11 1.1.4 Sơ đồ tổng quan của hệ thống nhận dạng. 11 1.2 Bài toán nhận dạng ký tự 12 1.2.1 Mở đầu 12 1.2.2 Sơ đồ tổng quát của một hệ nhận dạng chữ viết 14 1.2.2.1 Giai đoạn xử lý sơ bộ 14 1.2.2.2 Giai đoạn tách chữ 15 1.2.3 Nhận dạng bằng phương pháp đối sánh mẫu 16 1.2.3.1 Phương pháp dùng dãy điểm đặc trưng 16 1.2.3.2 Phương pháp lưới 17 1.2.3.3 Phương pháp cung 17 1.2.3.4 Phương pháp chia miền và đo mật độ 18 1.2.4 Nhận dạng bằng phương pháp phân tích cấu trúc 18 1.2.4.1 Phương pháp phân tích đường đơn 18 1.2.4.2 Phương pháp phân tích hình học 19 1.2.4.3 Phương pháp phân tích đường biên 20 1.2.4.4 Phương pháp sử dụng hình chiếu 20 1.3 Một số thuật toán nhận dạng mờ 22 1.3.1 Các thuật toán phân hoạch 24 1.3.1.1 Thuật toán cMeans rõ (Hard cMeans hay HCM) 24 1.3.1.2 Thuật toán cMeans mờ (Fuzzy cMeans hay FCM). 27 1.3.2 Thuật toán nhận dạng chữ số hai mức xám 29 1.3.2.1 Phương pháp so sánh vector mờ. 30 1.3.2.2 Phương pháp đối sánh hai tập mờ 31 1.3.3 Thuật toán nhận dạng chữ số đa mức xám. 33 1.3.3.1 Phương pháp dùng ma trận nhân 36 1.3.3.2 Phương pháp dùng ma trận mặt nạ. 42 Chương 2: Xây dựng ứng dụng 44 2.1 Không gian biểu diễn đối tượng 44 2.2 Qúa trình học 44 2.3 Qúa trình nhận dạng và ra quyết định 47  

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN -oOo - BÁO CÁO THỰC TẬP TỐT NGHIỆP Đề tài: Nghiên cứu nhận dạng chữ số viết tay sử dụng logic mờ Lớp KTPM1 – K5 Giảng viên Sinh viên Ths Nguyễn Lan Anh Nguyễn Quang Hưng Nguyễn Hoàng Long LỜI CẢM ƠN Đề tài “Nghiên cứu nhận dạng chữ số viết tay sử dụng logic mờ” với tìm hiểu trình thực thành viên nhóm, với bảo hướng dẫn của thầy giáo Dù trình thực đề tài nhiều khó khăn tiếp cận với thực tiễn thời gian cho phép chúng em nỗ lực cố gắng, trao đổi, thảo luận, tìm tòi kỹ lưỡng vấn đề khía cạnh khó hoàn thành tốt đề tài giao Qua chúng em xin chân thành cám ơn cô Nguyễn Lan Anh tận tình bảo, hướng dẫn thực đề tài, đồng thời đưa lời khuyên kinh nghiệm quý báu để chúng em hoàn thành thật tốt đề tài Kết thúc đề tài, nhóm chúng em mong nhận ý kiến đóng góp từ phía thầy cô bạn để hoàn thiện đề tài giao Nhóm sinh viên Nguyễn Quang Hưng Nguyễn Hoàng Long MỤC LỤC: LỜI NÓI ĐẦU Nhận dạng ký tự kỹ thuật sử dụng để chuyển đổi ảnh văn sang dạng văn chỉnh sửa máy tính Nó ứng dụng công tác quét lưu trữ tài liệu cũ, đẩy nhanh việc nhập liệu vào máy với lỗi Việc nhận dạng chữ in tay, chữ thảo tay, chí phiên đánh máy in vài chữ (đặc biệt chữ có số chữ lớn), đề tài nghiên cứu Các hệ thống nhận dạng ký tự viết tay đạt thành công lớn mặt thương mại năm gần Trong số thiết bị nhập cho thiết bị hỗ trợ cá nhân (PDA) phần mềm chạy Palm OS hãng Apple Newton tiên phong công nghệ Những giải thuật sử dụng thiết bị sử dụng ưu điểm thứ tự, tốc độ, hướng đoạn dòng đơn lẻ biết trước Tương tự, người dùng yêu cầu sử dụng vài loại kiểu chữ định Những phương pháp dùng phần mềm scan tài liệu giấy, nhận dạng xác văn in tay vấn đề lớn bỏ ngỏ Với mức xác từ 80% đến 90%, ký tự in tay nhận ra, độ xác tạo hàng tá lỗi trang, khiến cho công nghệ hiệu vài trường hợp Sự đa dạng OCR biết đến công nghiệp ICR, (Intelligent Character Recognition - Nhận dạng Ký tự Thông minh) Nhận dạng chữ viết tay lĩnh vực nghiên cứu sôi nổi, với tỷ lệ nhận dạng chí thấp văn in tay Tỷ lệ nhận dạng cao viết tay chung chung không sử dụng thông tin ngữ pháp văn cảnh Ví dụ như, nhận dạng chữ từ từ điển dễ việc cố gắng lấy ký tự rời rạc từ đoạn Đọc dòng Tổng cộng tờ séc (luôn viết số) ví dụ sử dụng từ điển nhỏ tăng tỷ lệ nhận dạng nhiều Kiến thức ngữ pháp ngôn ngữ scan giúp xác định từ động từ hay danh từ, ví dụ vậy, cho phép độ xác cao Hình dạng chữ viết tay thân không chứa đủ thông tin để nhận dạng xác (hơn 98%) tất đoạn chữ viết tay NỘI DUNG Chương 1: Cơ sở lý thuyết 1.1 Tổng quan hệ thống nhận dạng Nhận dạng đối tượng (Pattern Recognition) định nghĩa trình phân loại đối tượng biểu diễn theo mô hình gán cho chúng vào lớp dựa theo quy luật mẫu chuẩn, định nghĩa phương tiện để xây dựng hệ thống tin học có khả "Cảm nhận - nhận thức - nhận biết" đối tượng vật lý gần giống khả người Nhận dạng có gắn với ba khả lĩnh vực rộng lớn có liên quan đến việc xử lý tín hiệu đầu vào không gian nhiều chiều, mô hình hoá toán, lý thuyết xử lý ảnh, sở liệu, phương pháp định Một hệ thống nhận dạng hoàn chỉnh phải có khả thể trình nhận thức người qua mức: Mức cảm nhận: cảm nhận tồn đối tượng quan sát hay đối tượng mà hệ thống cần nhận dạng Mức đưa trình thu nhận số liệu qua cảm biến hệ thống nhận dạng Ví dụ hệ thống nhận dạng xử lý ảnh, đối tượng file ảnh lưu trữ dạng số thu nhận đầu vào qua scanner file ảnh Mức nhận thức: biểu diễn trình học, mô hình hoá đối tượng để tiến tới hình thành phân lớp (classification) Mức nhận biết: từ đối tượng quan sát trả lời nhận biết đối tượng gì? thuộc vào lớp lớp biết Đây trình định 1.1.1 Đối tượng nhận dạng Đối tượng nhận dạng (pattern object) coi thực thể vật lý tồn mà người cảm nhận miêu tả đo lường Ví dụ hình ảnh, âm cảm nhận mắt tai, thu nhận qua cảm biến máy quay phim, máy ảnh số Có hai loại đối tượng chính: - Đối tượng biểu diễn định lượng đối tượng mà đặc tính đo lường biểu diễn số - Đối tượng biểu diễn định tính đối tượng mà đặc tính biểu diễn dạng miêu tả hay đặc trưng ký hiệu Trong đối tượng nghiên cứu, tìm tập hợp đối tượng có chung nhiều đặc trưng (thuộc tính) tập hợp đối tượng gọi lớp đối tượng (class) Quá trình bao gồm việc xác định lớp đối tượng cho phân biệt lớp với trình hình thành phân lớp, nhờ trình hệ thống sau tiếp nhận đối tượng đầu vào nhận biết trả lời đối tượng thuộc lớp (đây trình định) Sự phân lớp trình nhận dạng Quá trình xuất phát từ biểu diễn, quan sát đối tượng trình cảm nhận để tìm đặc tính đặc trưng cho đối tượng vật lý gọi trình trích chọn đặc trưng hay gọi khâu mô hình hóa đối tượng Quá trình trích chọn đặc trưng khác tùy thuộc vào đối tượng cần nhận dạng Trong toán nhận dạng quan tâm đến: - Không gian biểu diễn: tập hợp ký hiệu, số liệu miêu tả đối tượng sau trình cảm nhận - Không gian đặc trưng: tập hợp miêu tả đặc trưng sau trình trích chọn đặc trưng - Không gian diễn dịch: tập hợp tên đối tượng tên lớp đối tượng cho phép nhận biết đối tượng quan sát thuộc lớp 1.1.2 Mô hình hóa toán nhận dạng Gọi X đối tượng nhận dạng: X=(x1, x2, , xn), xi ∈R Gọi χ không gian biểu diễn đối tượng: χ = {X1, X2, Xm} Gọi Ω không gian diễn dịch, tập tên gọi lớp C1, C2, , Cn Ω = {ω1, ω2, , ωn} Quá trình nhận dạng đối tượng tìm quy luật ξ ánh xạ từ không gian biểu diễn χ sang không gian diễn dịch Ω: ξ : χ → Ω cho Xj ∈ Ck (đối tượng Xj thuộc vào lớp Ck) Như hệ thống nhận dạng, đối tượng nhận dạng X biết qua quan sát, đo lường, cảm nhận không gian diễn dịch Ω quy luật ξ biết trước sở tri thức (ví dụ nhận dạng chữ viết), điều chưa biết Bài toán xây dựng hệ thống tự cấu trúc, đòi hỏi trình học từ đối tượng quan sát thu nhận (xác định không gian Ω) đến việc tìm quy luật ξ (ra định) 1.1.3 Các vấn đề hệ thống nhận dạng Quá trình nhận dạng bao gồm ba giai đoạn chính: - Lựa chọn mô hình biểu diễn đối tượng - Lựa chọn luật định (phương pháp nhận dạng) suy diễn trình học - Nhận dạng Khi mô hình biểu diễn đối tượng xác định, trình nhận dạng chuyển sang giai đoạn học Học giai đoạn quan trọng, thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành lớp Việc nhận dạng tìm quy luật thuật toán để gán đối tượng nhận dạng vào lớp hay nói cách khác gán cho đối tượng tên Khi số lớp quy luật biết trước, ta gọi học có mẫu ngược lại gọi học mẫu tự học 1.1.3.1 Mô hình hóa đối tượng thu nhận (trích chọn đặc trưng) Gọi X đối tượng nhận dạng: X = (x 1, x2, , xn), xi ∈ R χ = {X} không gian quan sát thu nhận γ = {Y} không gian đặc tính Quá trình mô hình hóa đối tượng hay trích chọn đặc trưng trình tìm ánh xạ ψ : χ → {X} cho đối tượng Y biểu diễn đặc trưng Các đặc trưng đối tượng phải đạt tiêu sau: - Giảm thứ nguyên không gian biểu diễn - Đảm bảo lượng thông tin đủ để phân biệt đối tượng - Cô đọng đặc trưng Giải trình nhận dạng có liên quan mật thiết đến kiểu mô hình hóa mà ta sử dụng để đặc tả đối tượng Trong nhận dạng người ta phân chia làm hai họ lớn: - Họ mô tả theo tham số (định lượng) - Họ mô tả theo cấu trúc (định tính) 1.1.3.2 Mô hình tham số Ta sử dụng vector để đặc tả đối tượng Một phân tử vector mô tả đặc trưng đối tượng Giả sử đối tượng nhận dạng X = (x1, x2, , xn), xi ∈ R χ = {X} không gian vector n chiều Trong đặc trưng hình học, người ta hay sử dụng chu tuyến, đường bao, diện tích Trong toán nhận dạng chữ tham số dấu hiệu: số điểm chạc ba, chạc tư, số điểm chu trình, số điểm ngoặt, số điểm kết thúc Ví dụ chữ A có điểm chạc ba, điểm kết thúc 1.1.3.3 Mô hình cấu trúc Cách tiếp cận mô hình dựa vào việc tìm kiếm ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng số dạng nguyên thủy đoạn thẳng, cung v.v Một hình chữ nhật định nghĩa gồm 04 đoạn thẳng vuông góc với đôi Trong mô hình người ta sử dụng ký hiệu kết thúc Vt Thuật ngữ vay mượn lý thuyết ngôn ngữ hình thức Người ta sử dụng ký hiệu không kết thúc gọi Vn Chúng ta cần xây dựng tập luật sản xuất dựa vào mối quan hệ dạng nguyên thủy ngữ cảnh Trong cách tiếp cận này, người ta chấp nhận tiên đề cho rằng: cấu trúc dạng kết việc áp dụng luật sản xuất theo nguyên tắc xác định dạng gọi dạng bắt đầu Một cách hình thức, ta coi mô hình tương đương với văn phạm G = (Vt, Vn, P, S) với: Vt : ký hiệu kết thúc Vn : ký hiệu không kết thúc P : luật sản xuất S : dạng (ký hiệu bắt đầu) 1.1.3.4 Quá trình học Quá trình học thực chất trình nhóm đối tượng vào lớp có số đặc trưng chính, có số phương pháp sau: Học có mẫu (supervised learning): trình học bắt đầu mẫu tồn phân lớp số đối tượng mẫu, biết đặc trưng lớp đối tượng Ví dụ toán nhận dạng chữ viết, ta biết trước tập quy luật tập tên đối tượng nhận dạng (có lớp chữ số A đến Z, 0, ) Học có mẫu nhằm định nghĩa lớp trường hợp tổng quát không gian đối tượng hay nói cách khác xác định phương trình biên giới lớp để cho nhận biết đối tượng thuộc lớp Trong trường hợp ta biết T = {X j, ωk} với j = [1, ,M], k = [1, ,N] tức biết đối tượng X j thuộc vào lớp ωk với i 10 S im, j,d (5,2) = M im, j,d (5,2) − mim, j,d (5,2) = µ im (r1, c5) ∨ µ dj (r1, c 2) − µ im (r1, c5) ∧ µ dj (r1, c 2) (3.51) Vì phép tính mờ ∧ ∨ thỏa mãn tính chất giao hoán vậy: {M m,m i, j {M m,d i, j − mim, j,m (r , c)} = { M im, j,m (r , c) − mim, j,m (c, r )} T } { (3.52) } (r , c) − mim, j,d (r , c ) = M mj ,i,d (c, r ) − m mj ,i,d (c, r ) T (3.53) Khai triển phương trình ta được: θM[µM(mi), µD(dj)] = µM(mi) ∨ µD(dj) = (3.54) =  µ im (r1 , c1 ) ∨ µ dj (r1 , c1 ) µ im (r1 , c1 ) ∨ µ dj (r1 , c ) µ im (r1 , c1 ) ∨ µ dj (r16 , c16 )   m  d m d m d  µ i (r1 , c ) ∨ µ j (r1 , c1 ) µ i (r1 , c ) ∨ µ j (r1 , c ) µ i (r1 , c ) ∨ µ j (r16 , c16 )       µ m (r , c ) ∨ µ d (r , c ) µ m (r , c ) ∨ µ d (r , c ) µ m (r , c ) ∨ µ d (r , c )  j 1 i j i j 16 16  i     m  d m d m d  µ i (r16 , c16 ) ∨ µ j ( r1 , c1 ) µ i (r16 , c16 ) ∨ µ j (r1 , c ) µ i (r16 , c16 ) ∨ µ j (r16 , c16 )  = [µ D (d j ) ∨ µ M (m j ) ] T Do ta kết luận {S m,d i, j (r , c) = S dj ,,im (c, r ) } { } {S m,m i, j (r , c)} = { S mj ,i,m (r , c)} T (3.55) T (3.56) Nhận xét: 48 Ta nhận thấy giá trị phần tử ma trận nhân S im, j,m (r , c ) có giá trị nhỏ hai toán hạng có giá trị giống hoàn toàn tức hai chữ số chuẩn phép toán quan hệ giống nhau, i = j chúng có giá trị lớn hai chữ số khác Cũng nhận xét vậy, giá trị phần tử ma trận nhân S im, j,d (r , c) có giá trị lớn mà mẫu cần nhận dạng chữ số chuẩn đem so sánh khác nhiều Giá trị phần tử đường chéo ma trận nhân kết phép toán mờ đối sánh giá trị hàm thuộc điểm ảnh tương ứng ma trận ảnh chữ số Giá trị phần tử đường chéo ma trận nhân lấy độ lệch tương quan giá trị hàm thuộc điểm ảnh với tất điểm ảnh khác ma trận ảnh, trừ điểm ảnh có vị trí tương ứng Căn vào nhận xét ta thấy dùng giá trị ma trận nhân phục vụ cho việc đối sánh mẫu cần nhận dạng chữ số chuẩn từ việc đánh giá giá trị đưa định chắn cho việc nhận dạng mẫy chữ số Thuật toán giải nhận dạng: Tư tưởng xây dựng thuật toán đánh giá độ tương quan mẫu cần nhận dạng với chữ số chuẩn từ điển liệu thông qua giá trị ma trận nhân Khả giống hai ma trận điểm ảnh phản ánh qua giá trị phần tử ma trận nhân S im, j,d (r , c) Ta cần phải đem so sánh mẫu cần nhận dạng với tất chữ số chuẩn từ điển Chữ số chuẩn có tổng giá trị ma trận nhân với mẫu cần nhận dạng có giá trị lớn chữ số giống với mẫu cần nhận dạng Ở có ý phần tử đường chéo ma trận nhân đóng góp phần 49 nhỏ vào phép so sánh thân chúng phép so sánh tương quan thêm Giá trị ma trận nhân S im, j,d (r , c) xây dựng lại sau: a ∀r = c (các phần tử đường chéo) - Nếu S im, j,m (r , c ) = - Hoặc S im, j,d (r , c) ≤ 0.5 S im, j,m (r , c) = (3.57) S im, j,d (r , c) > 0.5 (3.58) Hoặc phương trình (3.57) phương trình (3.58) đúng, giá trị ma trận nhân điểm tăng lên đến b ∀r ≠ c (các phần tử đường chéo) - Nếu S im, j,m (r , c) = - Hoặc S im, j,d (r , c) ≤ 0.5 S im, j,m (r , c) = (3.59) S im, j,d (r , c) > 0.5 (3.60) Một hai phương trình (3.59) (3.60) đúng, giá trị điểm đường chéo tăng lên Đồ thị cho việc đưa định giá trị phần tử ma trận nhân thể hình 3.2 Toàn giá trị ma trận nhân mặt nạ thứ i liệu j sau xây dựng lại kết hợp tổng số D(i,j) sau: D(i,j) = Tổng giá trị có trọng số mặt chữ số chuẩn thứ i liệu cần nhận dạng thứ j ∑ = r c ∑∑ (giá trị đường chéo) + 1/256 đường chéo) 50 r c (các giá trị 1.0 0.5 m,m 0.5 1.0 S ij (r,c) Hình 3.2 Đồ thị định ma trận nhân Ý tưởng tính giá trị S im, j,m (r , c) ta xem vector hàm thuộc liệu cần nhận dạng chuẩn lọc thứ i Vì giá trị tham chiếu S im, j,m (r , c) tạo Chú ý hai giá trị phần tử S im, j,m (r , c ) S im, j,m (r , c) bị giới hạn khoảng [0,1] Vì giới hạn D(i,j) thiết lập: 511 ≥ D(i,j) ≥ (3.61) Mỗi giá trị số 256 khoảng cách theo đường chéo 65280 giá trị đường chéo hình thành lên giới hạn ma trận nhân Giới hạn 511 D(i,j) xác định qua thực nghiệm Hệ số trọng lượng 1/256 chọn xác thông qua thực nghiệm Hệ số đưa ta có nhiều khoảng cách đường chéo (65280) nhiều khoảng cách đường chéo (256) chúng không nhấn mạnh Ngưỡng giá trị hàm thuộc 0.5 chọn tín hiệu nhiễu coi phân bố đồng mẫu Cuối kỹ thuật nhận dạng mờ phát chọn lọc mẫu cần nhận dạng thứ j chữ số mk nếu: ∀MaxD(i,j) = D(i,k) 51 1.3.3.2 Phương pháp dùng ma trận mặt nạ Cho dù khái niệm thiết kế kỹ thuật nhận dạng mờ khác với kỹ thuật nhận dạng mờ phương pháp ma trận nhân, công cụ toán học sở sử dụng hai kỹ thuật nhận dạng mờ giống Để lấy giá trị hàm thuộc, kỹ thuật nhận dạng dùng ma trận vuông di chuyển có kích thước x 3, gọi ma trận mặt nạ x Ma trận 16 x 16 mặt nạ vuông x Nếu xét theo giá trị hàm thuộc, ma trận vuông di chuyển x biểu diễn sau: µG(g) = [0,0, ,0,1,1,1,0 0,1,1,1,0 0,1,1,1,0 0] (3.62) ↑ vị trí thứ α Ở α = 1, 2, , 196 sử dụng số đánh dấu vị trí bắt đầu ma trận mặt nạ (xem hình 3.4) Vector hàm thuộc ma trận mặt nạ trường nhị phân vector mờ Bài toán đặt giả sử ta có liệu cần nhận dạng mô tả vector hàm thuộc µD(dj) từ điển chữ số chuẩn, sử dụng phép toán mờ phép toán Boolean để nhận mẫu liệu ký chữ số từ điển 52 a Chữ số số "2" chuẩn b Phần bù chữ số số "2" Nhận xét: Bài toán nhận dạng giải dựa nhận xét sau: ta xếp chồng ảnh chữ số số "2" phần bù ta hình mầu đen hay có nghĩa tổng giá trị hàm thuộc có giá trị lớn Trong ví dụ ta có giá trị Max = 256 Và tổng giá trị hàm thuộc giảm mà ảnh xếp chồng lên ảnh chữ số số "2" giống ta nhận giá trị Min = 127 ảnh chữ số số "2" chữ số trắng Như cách giải toán nhận dạng xếp chồng ảnh chữ số mẫu chuẩn từ điển lên mẫu cần nhận dạng Tại vị trí điểm ảnh trùng với giá trị số chữ số chuẩn ta nguyên giá trị điểm ảnh cần nhận dạng Tại vị trí lại ứng với giá trị ta lấy giá trị phần bù điểm ảnh này, sau tính tổng cho tất giá trị chúng Tương tự tính tiếp cho tất chữ số chuẩn lại khác từ điển Quyết định toán nhận dạng là: mẫu cần nhận dạng chữ số chuẩn sinh tổng giá trị hàm thuộc lớn 53 Chương 2: Xây dựng ứng dụng Như giới thiệu chương trước, có nhiều phương pháp nhận dạng chữ số khác nhau, phạm vi môn học chúng em chọn thuật toán nhận dạng mẫu phương pháp đối sánh hai tập mờ lý thuyết logic mờ Phương pháp nhận dạng có ưu điểm đơn giản, song kết nhận dạng chưa tốt vì: - Mẫu nhận dạng mẫu đơn, tức mô tả đặc trưng - Chữ số nhận dạng bao gồm hai mức xám, nên thuật toán có hiệu chữ số không bị tác động nhiều nhiễu - Chương trình chưa cài đặt phần phân hoạch chữ số vào lớp nhận dạng 2.1 Không gian biểu diễn đối tượng Để biểu diễn đối tượng, dùng đối tượng ảnh, đối tượng thứ dùng để vẽ chữ số, đối tượng thứ chia thành lưới 16x16 dùng để lưu trữ cấu trúc chữ số theo kích thước cố định, tương ứng với ma trận 16x16 Mỗi ô vuông coi điểm ảnh chữ số lưu trữ vào ma trận vị trí tương ứng, nghĩa ô (i,j) có điểm ảnh vị trí (i,j) ma trận có giá trị 1, ngược lại có giá trị Cơ sở tri thức(các mẫu học) lưu trữ dạng file có cấu trúc, mẫu lưu trữ file, liệu file cập nhật từ ma trận Một chữ số có nhiều mẫu học, xem lại mẫu học xóa mẫu 2.2 Qúa trình học Tổ chức File lưu trữ liệu : File lưu trữ liệu dạng File có cấu trúc sau : Type Mau 54 Char as string *1 Data (0 To R_grid - 1, To H_grid - 1) As byte DataFile As String * 15 PictureFile As String * 15 End Type Trong đó: Char chữ số cần học, R_grid =16 H_grid =16 kích thước ma trận lưu giá trị DataFile lưu tên file liệu mẫu, PictureFile lưu tên file ảnh mẫu Type TansuatOfChar Char As String * Tansuat(0 To R_grid - 1, To H_grid - 1) As Long ArrayMau() as Mau – Các mẫu học Tong As Long tổng số mẫu End Type Cấu trúc liệu dùng để lưu trữ tần suất chữ số Bài toán học : Mỗi mẫu đưa vào chia thành ô với R_grid cột H_grid hàng sử dụng hàm GetPixel để lấy giá trị màu điểm ảnh Nếu giá trị khác giá trị coi điểm ảnh thuộc chữ số, ô lưới có nhiều điểm ảnh ta đặt ngưỡng lọc ví dụ số điểm ảnh thuộc chữ số ô > k giá trị ô tính =1 ngược lại = Sau thực học chữ số có mẫu thứ n tương ứng Database cập nhật sau: Tong = Tong +1 TanSuat(i,j) = TanSuat(i,j) + ArrayMau(n).Data(i,j) Bước 1: Xử lý ảnh Xác định vùng ảnh chữ số thật cách tìm biên trên, dưới, trái, phải ảnh 55 Bước 2: Chia ảnh thành ô lưới xác định giá trị cho ô lưới = ô có >=1 điểm vẽ =0 ngược lại Bước 3: Lưu trữ mẫu thành file liệu thư mục chữ số học với tên file số nguyên ngẫu nhiên đảm bảo file chưa tồn trước Như vậy, chữ số học có thư mục tương ứng Ta có sơ đồ thể qúa trình học sau: Xử lý ảnh (Xác định vùng chữ số) Chia ảnh thành ô lưới Xác định giá trị (0,1) cho ô lưới Chữ số học False Tạo file liệu tương ứng 56 KẾT THÚC True 2.3 Qúa trình nhận dạng định Thuật toán nhận dạng dùng tiểu luận thuật toán đối sánh hai tập mờ Giả sử ta có sở tri thức A (tập A học) mẫu cần dạng B, giả sử ta cần đối sánh mẫu B với phần tử A k tập học sau: Bước : Tính (Ak,µ) = {(a1, 0), (a2,0), (a3,1), (a4,1), (a5,0), (a6,0), (a7,0), (a8,1/3) , (a9, 1/3) (a36,1/3) } Trong đó, tần suất Ak tính sau: Ak(i, j) = ∑ Mau (i, j ) Bước : Làm rõ theo công thức sau : µ’ = µ µ’ = - ( - µ)2 =< µ [...]... thống nhận dạng Để đánh giá chất lượng nhận dạng, ta sử dụng chỉ số nhận dạng τ được đo bằng tỷ số giữa đối số đối tượng nhận dạng đúng và tổng số các đối tượng quan sát thu nhận Các hệ thống nhận dạng có τ ≥ 90% là những hệ thống đạt yêu cầu về chất lượng Giá trị τ không thể đạt 100% vì có sự tồn tại sai số tự nhiên đối với những đối tượng sát biên và trên thực tế các đối tượng quan sát thu nhận là... và Khoa học máy tính, nhận dạng chữ viết tập trung nghiên cứu phát triển nhằm mục tiêu nâng cao tính ổn định và tính linh hoạt, có khả năng tự thích nghi với các dạng chữ viết khác lạ Người ta quan tâm tới lĩnh vực nhận dạng chữ viết không chỉ vì nhu cầu cuộc sống, mà còn vì ham muốn hiểu rõ hơn quá trình nhận thức của mình Những phương pháp tiếp cận khác nhau trong nhận dạng chữ viết cũng được nảy sinh... mô hình Markov ẩn để nhận dạng đạt độ chính xác 96.7%, đây là một hiệu suất cao trong nhận dạng chữ tượng hình 26 1.3 Một số thuật toán nhận dạng mờ Logic mờ được phát triển từ lý thuyết tập mờ để thực hiện lập luận một cách xấp xỉ thay vì lập luận chính xác theo lôgic vị từ cổ điển Logic mờ có thể được coi là mặt ứng dụng của lý thuyết tập mờ để xử lý các giá trị trong thế giới thực cho các bài toán... với mẫu cần nhận dạng theo phương pháp dưới đây: µAi(x0) = max {µA1(x0), µA2(x0), , µAm(x0)} (3.25) Ở đây x0 sẽ thuộc về tập mờ Ai Bây giờ ta hãy mở rộng để xem xét trường hợp mẫu dữ liệu cần nhận dạng không phải là tập cổ điển mà là tập mờ Giả sử có m mẫu đã biết và được mô tả bởi các tập mờ A i trên tập X Mẫu cần nhận dạng gồm một nhóm các giá trị quan sát được Chúng được mô tả bởi tập mờ B trên X... việc nhận dạng mẫu chữ về việc nhận dạng các hình chiếu, còn việc nhận dạng như thế nào hoàn toàn có thể sử dụng phương pháp đối sánh mẫu Tuy nhiên để tận dụng được các ưu điểm của hình chiếu, người ta vẫn thường dùng phương pháp phân tích đường biên Trong công trình nhận dạng bộ chữ số Hangul (Hàn Quốc), Hee-Seon Park và Seong-Whan Lee đã mã hoá đường biên các hình chiếu dưới dạng mã Freeman và sử dụng. .. các chữ "Y" và "N", "C" và "K", ) và cho phép một số sai sót nhất định Thống kê các 24 phiếu điều tra là một ví dụ ứng dụng cho phương pháp sử dụng hình chiếu Phương pháp sử dụng hình chiếu tức là sử dụng biểu đồ mật độ thay cho chữ Thông thường người ta sử dụng bốn loại biểu đồ mật độ - Biểu đồ mật độ ngang (HRPCT ): Là lược đồ xám ngang của chữ - Biểu đồ mật độ dọc (VRPCT ): Là lược đồ xám dọc của chữ. .. một tập các đối tượng quan sát để thử và đánh giá chất lượng đối tượng quan sát được nhận dạng khác với tập các đối tượng để học 1.2 Bài toán nhận dạng ký tự 1.2.1 Mở đầu Năm 1929, Tausheck đã được cấp một bằng sáng chế về nhận dạng chữ viết tại Đức và năm 1933, Handel cũng được cấp bằng tại Mỹ Đây là những ý tưởng đầu tiên về nhận dạng chữ viết Những kỳ vọng về một cỗ máy có khả năng đọc các chữ và số. .. chỉ có một đặc trưng tức là một chiều Giả sử ta có một số mẫu trong cơ sở tri thức và ta nhận được một mẫu dữ liệu cần nhận dạng chưa được phân loại Ta cần xác định mẫu nào trong cơ sở tri thức giống nhất với mẫu dữ liệu cần nhận dạng này Ta mô tả các mẫu đã biết là các tập mờ A1, A2, ,An Ta giả sử mẫu dữ liệu cần nhận dạng được đặc trưng bởi tập cổ điển x 0 Sử dụng tiêu chuẩn giá trị hàm thuộc cực đại,... các điểm giả tạo trên biên Làm đầy ch : Thủ tục làm đầy chữ áp dụng cho các chữ số bị đứt nét một cách ngẫu nhiên Ví dụ chữ "m" bị đứt nét dễ bị nhận dạng nhầm thành chữ "n" hoặc chữ "r" Làm mảnh ch : Làm mảnh biên chữ thực chất là làm nổi biên với độ rộng chỉ 1 pixel Một phần tử sẽ được loại bỏ ra khỏi biên khi nó thoả mãn một trong 2 điều kiện sau: + Nó là điểm đen duy nhất kết nối 2 điểm đen không... làm hai hướng chính: Phương pháp đối sánh mẫu (template matching method) và phương pháp phân tích cấu trúc (structure analysis) 15 1.2.2 Sơ đồ tổng quát của một hệ nhận dạng chữ viết Một hệ thống nhận dạng thường gồm các khối chính, phù hợp với các giai đoạn xử lý sau: - Khối xử lý sơ bộ - Khối tách chữ - Khối nhận dạng chữ - Khối phục hồi chữ (hoàn thiện về nội dung và hình thức, chữa lỗi ) 1.2.2.1

Ngày đăng: 08/09/2016, 07:25

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan