Nghiên cứu phương pháp nhận dạng hình dạng

90 761 2
Nghiên cứu phương pháp nhận dạng hình dạng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu phương pháp nhận dạng hình dạng

BBộộ ggiiááoo ddụụcc vvàà đđààoo ttạạoo TTrrờờnngg đđạạii hhọọcc bbáácchh kkhhooaa HHàà nnộộii ------------------------------------------------------------------------------------------ LLuuậậnn vvăănn tthhạạcc ssĩĩ kkhhooaa hhọọcc NNgghhiiêênn ccứứuu pphhơơnngg pphháápp nnhhậậnn ddạạnngg hhììnnhh ddạạnngg NNggàànnhh:: xxửử llýý tthhôônngg ttiinn vvàà ttrruuyyềềnn tthhôônngg MM ssốố:: 442211 đđiinnhh tthhịị kkiimm pphhợợnngg NNggờờii hhớớnngg ddẫẫnn kkhhooaa hhọọcc:: TT SS NNgguuyyễễnn kkiimm aannhh HHàà nnộộii 22000066 - 2 - Lời cam đoan Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân dới sự hớng dẫn của TS. Nguyễn Kim Anh. Nếu có gì sai phạm, tôi xin hoàn toàn chịu trách nhiệm. Ngời làm cam đoan Đinh Thị Kim Phợng - 3 - Mục Lục Lời cam đoan 2 Mục Lục .3 Danh Mục Các từ viết tắt 6 Danh mục hình vẽ .7 Lời nói đầu .9 Chơng 1:Tổng quan về tìm kiếm ảnh dựa trên hình dạng .Error! Bookmark not defined. 1.1. Giới thiệu .12 1.2. Trích chọn đặc trng 13 1.2.1.Biến đổi Fourier .12 1.2.1.1.Chuỗi Fourier 13 1.2.1.2. Sự hội tụ của chuỗi Fourier 14 1.2.1.3. Biến đổi Fourier .14 1.2.1.4. Biến đổi Fourier rời rạc .15 1.2.1.5. Biến đổi Fourier hai chiều .16 1.2.1.6. Phạm vi của biến đổi Fourier .16 1.2.2. Không gian độ chia (Scale space) .17 1.2.2.1. Cơ sở 17 1.2.2.2. Không gian độ chia Gaussian 19 1.2.2.3. Phạm vi của sự không tạo các đặc trng mới 19 1.2.2.4. Không gian độ chia mâu thuẫn với việc đa quyết định .20 1.2.3.Thảo luận .22 1.3. Phép đo tơng đơng và thực hiện phép đo .22 1.3.1. Phép đo sự giống nhau 23 1.3.1.1. Không gian phép đo khoảng cách (Distance Metric Spaces) .24 1.3.1.2. Khoảng cách dạng Minkowski 24 1.3.1.3. Khoảng cách Cosin 24 1.3.1.4. Thông tin thống kê 2 .25 1.3.1.5. Đờng giao biểu đồ .25 - 4 - 1.3.1.6. Khoảng cách bậc hai 26 1.3.1.7. Khoảng cách Mahalanobis 27 1.3.2.Thực hiện phép đo .27 1.3.2.1. Độ nhạy và độ chính xác(RPP). 28 1.3.2.2. Tỷ lệ trọng số thành công (PWH- Percentage of Weighted Hits) .28 1.3.2.3. Phần trăm của thứ bậc giống nhau (PSR-Percentage of Similarity Ranking ) 29 1.3.2.4. Thảo luận .30 1.3.3. Trích chọn đặc trng hình dạng 30 1.4. Thảo luận .32 Chơng 2 Phơng pháp tách contrario .33 2.1. Cluster có thứ bậc và đánh giá giá trị 34 2.1.1.Giá trị nhóm Contrario 34 2.1.1.1. Cơ sở: .34 2.1.1.2. Nhóm có ý nghĩa. 35 2.1.2. Tiêu chuẩn kết hợp tốt nhất. .37 2.1.3. Vấn đề tính toán .40 2.1.3.1. Lựa chọn vùng thử. 40 2.1.3.2. Riêng rẽ và cực đại. .42 2.2.1. Nhiễu điểm .43 2.2.2. Phân đoạn .43 2.3. Kết cấu nhóm và không gian tơng ứng 46 2.3.1. Tại sao phải tách kết cấu không gian. 46 2.3.2. Đối sánh nhân tố hình dạng 47 2.3.3. Biến đổi mô tả .49 2.3.3.1. Trờng hợp tơng đồng .49 2.3.3.2. Trờng hợp biến đổi mối quan hệ .50 2.3.4. Cluster có ý nghĩa của biến đổi 52 2.3.4.1. Phép đo sự không tơng đơng giữa các biến đổi .52 2.3.4.2 Phơng thức nền .52 2.3.4.3. Kỹ thuật nhóm .54 2.4. Thảo luận .55 Chơng 3:Phơng pháp ra quyết định Contrario 56 3.1. Một quyết định Contrario 58 3.1.1. Phơng pháp hình dạng trái ngợc phơng pháp nền 58 3.1.2. Phơng thức quyết định Contrario 59 3.1.3. Ước lợng xác suất cảnh báo sai 61 - 5 - 3.1.4. Luật ra quyết định Contrario 61 3.2. Tự động thiết lập ngỡng khoảng cách .62 3.2.1. Số các cảnh báo sai NFA 62 3.2.2. Đối sánh có ý nghĩa 63 3.2.3. Ngỡng nhận dạng tơng ứng với ngữ cảnh .64 3.2.4. Tại sao quyết định Contrario 65 3.3. Xây dựng đặc trng độc lập thống kê 66 3.4.Chuẩn hóa nhân tố hình dạng từ ảnh cho đặc trng độc lập .68 3.4.1. Biểu diễn hình dạng bằng các mức đờng 68 3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ .70 3.4.2.1. Mã hóa / Tiêu chuẩn hóa trị không đổi tơng đơng 71 3.4.2.2. Mã hóa / Chuẩn hóa quan hệ bất biến .73 3.4.3. Từ chuẩn hóa nhân tố hình dạng đến đặc trng độc lập .73 3.5. Thảo luận .76 Chơng 4Thử nghiệm .78 4.1. Thử nghiệm phơng pháp nền .78 4.2. Thử nghiệm phơng pháp Contrario 80 4.2.1. Hai ảnh không quan hệ với nhau 80 4.2.2. Méo dạng quan sát xa gần 81 4.2.3. Quan hệ với sự nghẽn cục bộ và thay đổi độ tơng phản .83 Kết luận 88 Tài liệu tham khảo 89 Tóm tắt luận văn .90 - 6 - Danh Mục Các từ viết tắt STT Từ viết tắt ý nghĩa 1 CBIR Content Based Image Retrieval 2 FD Fourie Descriptor 3 FFT Fast Fourie Transform 4 CSDL Cơ sở dữ liệu 5 NFA Number of Fasle Alarm 6 PFA Pridicion Fasle Alarm 7 FT Fourie Transform 8 NFAg NFA of region 9 NFAgg NFA of region-region 10 Pro Proposition 11 PFA Probability of False Alarm - 7 - Danh mục hình vẽ Hình 1.1: Đối tợng bị làm nhiễu bởi biến đổi phổ. 13 Hình 1.2: ảnh và các biến đổi khác .13 Hình 1.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu .20 Hình 1.4: (a) Khoảng cách Ocolit, .25 (b) khoảng cách Cosin, (c) khoảng cách L1 .25 Hình 1:a) ảnh ký tự,b) mức đờng tơng ứng, c) Đoạn mức đờng .31 Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng 37 Hình 2.5: Vấn đề quan trọng của phân bố phơng thức nền 43 Hình 2.6: Phân đoạn ảnh đã scan và 71 đờng mức có mức ý nghĩa cực đại. .44 Hình 2.7: Nhóm với mối quan hệ tới hớng .45 Hình 2.8: Nhóm trong không gian(toạ độ x, hớng) 46 Hình 2.9: Thử nghiệm Guernica .48 Hình 2.10: Thử nghiệm Guernica quan hệ tơng ứng ý nghĩa không đổi 49 Hình 2.11: Hai đoạn mức đờng và khung tơng ứng .50 Hình 2.12: Thử nghiệm Guernica .51 Hình 3.1: Trích chọn mức đờng có ý nghĩa .70 Hình 3.3: Mã hoá sự không đổi tơng đơng bán cục bộ 73 Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi. . .74 Hình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến 75 - 8 - Hình 3.6: Mã hoá sự tơng đồng không đổi .76 Hình 4.1: ảnh và mức đờng có ý nghĩa .80 Hình 4.2: Thử nghiệm hitchcook 82 Hình 4.3: Phơng pháp nhận dạng bán cục bộ quan hệ không đổi 83 Hình 4.4: Phơng pháp nhận dạng quan hệ bán cục bộ không đổi 83 Hình 4.5 Phơng pháp nhận dạng bán cục bộ .84 Hình 4.6: Tập các đoạn đờng mức đối sánh với ảnh trong CSDL 85 Hình 4.7: Phơng pháp bán cục bộ tơng đồng không đổi 85 Hình 4.8: ảnh gốc và mức đờng có ý nghĩa .86 Hình 4.9: ảnh Menima và mức đờng có ý nghĩa .86 - 9 - Lời nói đầu Ngày nay thông tin nói chung sử dụng trong ảnh là phổ biến. Rất nhiều lĩnh vực sử dụng ảnh nh một công cụ để thực hiện công việc. Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng nh trạm vệ tinh, khó khăn trong lu trữ, chi phí cao cho xử lý và internet. Sự đa dạng các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số. Các ứng dụng của ảnh bao gồm: giải trí số, th viện số, giáo dục và World Wide Web (www). Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc. Lợi ích trớc mắt của ảnh số gồm cả mặt xã hội và thơng mại. Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiền bạc. Tuy nhiên, độ lớn của kho lu trữ ảnh số trên toàn thế giới có giới hạn, sự tận dụng ảnh số từ CSDL hiện tại khó hơn. Điều này là vì thiếu cách đánh chỉ mục và quản lý ảnh số chuẩn. Thông thờng các ảnh đợc lu trữ trong CSDL sử dụng dới dạng các thông tin thuộc tính. Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể cung cấp cho ngời sử dụng từ khoá tìm kiếm lớt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ nh ngôn ngữ truy vấn cấu trúc (SQL). Tuy nhiên, nhìn từ bên ngoài có hạn chế; một trong những hạn chế đó là thời gian tính toán khi CSDL lớn, nó dờng nh không thể chú giải thủ công tất cả các ảnh. Mặt khác các đặc trng thị giác của ảnh rất khó mô tả bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đó là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động hoá. Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR). CBIR đợc giới thiệu nh phần bổ xung cho việc tiến tới đánh chỉ mục thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia. Vì những - 10 - tiềm năng ứng dụng rộng rãi của nó, CBIR đã thu hút đợc số lợng lớn các chú ý trong những năm gần đây (KAT 92, NIB 93, YOS 99). Trong CBIR, ảnh trong CSDL là dữ liệu không cấu trúc, ảnh số hoàn toàn chỉ bao gồm mảng các pixel độ chói, không có ý nghĩ vốn có. Một trong những chìa khoá bắt nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, để phản ánh ngữ nghĩa ảnh. Vì vậy việc trích chọn hiệu quả các đặc trng ngữ nghĩa đó là điều cốt yếu sự thành công của CBIR. Nghiên cứu trên những yêu cầu của ngời sử dụng đối với ảnh từ bộ su tập ảnh biểu thị những đặc trng nguyên thuỷ đó nh màu sắc, kết cấu, hình dạng hoặc hỗn hợp của chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (EAK 99). Những đặc trng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài. Vì vậy đặc trng nguyên thuỷ của ảnh ở mức thấp có thể đợc bắt nguồn và khai thác để khuyến khích việc CBIR tự động hoá. *Đối tợng nghiên cứu Từ các thông tin cơ bản trên đây các ảnh trong CSDL có thể đợc đánh chỉ mục bằng cách sử dụng thông tin thuộc tính hoặc thông tin ngữ nghĩa. Ngữ nghĩa của ảnh có thể đợc mô tả sử dụng các đặc trng nguyên thuỷ; ví dụ: màu sắc, cấu trúc, hình dạng hoặc tổ hợp của chúng. Kết quả nghiên cứu này chấp nhận tiến tới CBIR, đó là việc đánh chỉ mục và tìm kiếm ảnh bằng ngữ nghĩa của ảnh. Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình dạng. Mục đích chủ yếu của cách tìm kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng. Điều tra các công nghệ và phát triển trong nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ tìm kiếm nhãn mác, nhận dạng đối tợng hoặc có thể hợp nhất trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc trng hỗn hợp của ảnh. [...]... 11 - Nhận dạng nói chung hội tụ các vấn đề của nhận dạng trực quan dựa trên thông tin hình dạng hình học Phơng pháp nhận dạng hình dạng thờng bao gồm 3 tiến trình: trích chọn đặc trng, đối sánh (cốt lõi của tiến trình này là định nghĩa 1 khoảng cách hoặc phép đo sự tơng đồng giữa các đặc trng hình dạng đợc mô tả) và ra quyết định Phần này chủ yếu nghiên cứu vấn đề ra quyết định cho đối sánh hình dạng, ... chung giữa hai hình dạng giống nhau để đối sánh, nó có thể đi tới quyết định nh thế nào? Mục đích để định nghĩa tiêu chuẩn thống kê dẫn tới quyết định 2 hình dạng là giống hay không Nghiên cứu các tiến trình thực hiệnnhận dạng hình dạng theo trình tự các công đoạn: từ công đoạn sơ khai biểu diễn ảnh, trích chọn đặc trng, tách nhóm nhân tố hình dạng thành 1 hình dạng và chủ yếu là phơng pháp ra quyết... chúng chỉ là một, nhằm mục đích nhận dạng hình dạng Thuật toán đối sánh đợc tính toán tơng ứng của các nhân tố hình dạng giữa hai ảnh đem so sánh và thiết lập mối quan hệ không gian giữa các đối sánh nhân tố hình dạng đa vào ảnh Mỗi cặp đối sánh hình dạng dẫn tới 1 biến đổi xác định Chơng này giới thiệu lý thuyết lựa chọn nhóm đúng để nhóm các nhân tố hình dạng thành một hình dạng dựa vào việc tách nhóm... tơng đồng của các nhân tố hình dạng Khi các nhân tố hình dạng là một đoạn của mức đờng, mỗi thủ tục đối sánh với 1 phân tích tách biên đợc mô tả chi tiết Kết quả của thủ tục là một tập các cặp đối sánh nhân tố hình dạng Do đối sánh cục bộ không tách hai nhân tố hình dạng của cùng 1 hình dạng đơn vì vậy các nhân tố hình dạng phải nhóm cùng nhau Các nhóm tập các nhân tố hình - 34 - dạng đợc biến đổi từ ảnh... thức của con ngời khi nhận dạng hình dạng trong ảnh.Vì vậy nhân tố hình dạng thực sự không trọn vẹn các cung tơng ứng của đờng viền đối tợng, chỉ là một đoạn đối tợng Trong luận văn này chấp nhận biểu diễn nhân tố hình dạng với bất kỳ đoạn cung nào Thông tin về việc trích chọn nhân tố hình dạng từ ảnh nh thế nào là không cần thiết cho moment, ta sẽ tính toán tập các nhân tố hình dạng đợc trích chọn từ... thành các nhóm tự nhiên Phơng pháp này sử dụng cho vấn đề nhận dạng, đa vào hai ảnh, trả lời câu hỏi: hai ảnh có hình dạng nào chung Thay vì phải phân tích nhiều nhân tố hình dạng và định rõ chúng trong mỗi cặp ảnh đợc đề cập mỗi nhân tố hình dạng đợc định nghĩa theo nhiều cách: nhân tố hình dạng tơng ứng nh các đoạn mức đờng đã đợc mã hóa trong mối quan hệ xác định Bớc nhận dạng tiếp theo là đối sánh... chọn từ một ảnh đợc giới thiệu phù hợp với biểu diễn ngữ nghĩa hình dạng của chúng Khi hình dạng là đối tợng bị ảnh hởng của méo dạng xa gần, bằng nhận thức của mình con ngời vẫn có thể nhận dạng dạng đúng đối tợng Để so sánh, biểu diễn hình dạng là không đổi với các phép biến đổi này và không đề cập tới các phép biến đổi trong đối sánh hình dạng, vì chúng cho phép vạch ra một lớp lớn các cung thành một... trng hình dạng Trích chọn thông tin hình dạng từ dữ liệu ảnh tập trung ở đờng viền và nhận thức về hình dạng là không thay đổi đối với thay đổi độ tơng phản( thay đổi trong độ chia màu sắc và độ chói) Hình dạng hình học có đợc mô hình nh - 31 - đờng cong khép kín Tuy nhiên trong một vài quan sát gần đây một phần đối tợng khi quan sát bị ẩn bởi các đối tợng khác, mặc dù vẫn còn giới hạn trong nhận. .. trên hình dạng 1.1 Giới thiệu Vấn đề cơ bản của tìm kiếm ảnh dựa trên hình dạng là phép đo sự tơng đồng giữa các các hình dạng đợc mô tả bởi các đặc trng của chúng Vì vậy, hai bớc cần thiết trong tìm kiếm và nhận dạng ảnh dựa trên hình dạng đó là trích chọn đặc trng và phép đo tơng đơng giữa các đặc trng đã đợc trích chọn Hai công cụ cơ bản cần thiết đợc sử dụng trong trích chọn đặc trng hình dạng. .. trích chọn đặc trng, tách nhóm nhân tố hình dạng thành 1 hình dạng và chủ yếu là phơng pháp ra quyết định Contrario cho nhận dạng hình dạng *Cấu trúc luận văn Chơng 1 : Tổng quan về tìm kiếm ảnh dựa trên hình dạng Chơng 2: Tách nhóm Chơng 3: Phơng pháp Contrario cho nhận dạng hình dạng Chơng 4: Thử nghiệm Do thời gian và khả năng có hạn nên luận văn này sẽ còn nhiều thiếu sót Rất mong đợc sự góp ý và . đặc trng, tách nhóm nhân tố hình dạng thành 1 hình dạng và chủ yếu là phơng pháp ra quyết định Contrario cho nhận dạng hình dạng. *Cấu trúc luận văn Chơng. ảnh dựa trên hình dạng. Mục đích chủ yếu của cách tìm kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng. Điều tra

Ngày đăng: 10/11/2012, 10:09

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan