Thông tin tài liệu
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
1
Đề tài:
“Tìm hiểu kỹ thuật xây dựng giao diện người
dùng với cơ chế phản hồi ngôn ngữ tự nhiên”
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
2
Lời Nói Đầu
Ngày nay những nghiên cứu về lĩnh vực xử lý ngôn ngữ tự nhiên nhằm tạo cho
máy tính khả năng hiểu giao tiếp được bằng ngôn ngữ tự nhiên với con người đã
không chỉ còn là lý thuyết nữa mà đã đi vào xây dựng rất nhiều ứng dụng có hiệu
quả.Hơn nữa quá trình ứng dụng này còn có sự kết hợp giao thao của các nghành
chuyên môn khác nhau trong lĩnh vực tin học,có các kỹ thuật ứng dụng lập trình
logic,giao diện người dùng vào lĩnh xử lý ngôn ngữ tự nhiên.Vì vậy em chọn đề
tài “Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn
ngữ tự nhiên” một đề tài phản ánh được nội dung trên làm đề tài cho đồ án tốt
nghiệp của mình .
Do trình độ nhận thức còn hạn chế và hiểu biết chưa rộng nên trong đồ án của
em chắc chắn không tránh khỏi nhiều thiếu sót. Em rất mong nhận được sự chỉ bảo
của các thầy cô và các bạn!
Em chân thành cảm ơn TS. Lê Thanh Hương – cô giáo phụ trách hướng dẫn tốt
nghiệp đã gợi ý để em lựa chọn đề tài này và đã tận tình hướng dẫn trong suốt
quãng thời gian làm đồ án .
Em cũng xin gửi lời cảm ơn tới thày giáo Quách Tuấn Ngọc về những chỉ dẫn
của thày trên diễn đàn edu.net của bộ giáo dục về cách viết một đồ án tốt nghiệp
có hiệu quả,cảm ơn các bạn trong nhóm thực tập và các bạn trong lớp đã chia sẻ
kiến thức,thông tin có liên quan đến lĩnh vực của đồ án ,cũng như kinh những kinh
nghiệm lập trình hết sức bổ ích.
Cuối cùng, em xin được cảm ơn sự dạy dỗ nhiệt tình của các thầy cô giáo trong
khoa nói riêng và trong trường đã dạy dỗ em trong suốt 5 năm học dưới mái
trường ĐHBK thân yêu.
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
3
Hà nội ngày 23 tháng 5 năm 2006
Sinh viên thực hiện
Nguyễn Trung Thành
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
4
Mục lục
Lời nói đầu 1
Mục lục 2
Phụ lục 3
PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ NGÔN TRONG
THỰC TIỄN 4
1.1.Giới thiệu 4
1.2. Đặt vấn đề 5
1.2.1.Mục đích của đề tài 5.
1.2.2.Nội dung công việc 6
PHẦN 2:CƠ SỞ LÝ THUYẾT 7
2.1.Giao diện ngôn ngữ tự nhiên 7
2.1.1.Những ưu điểm của giao diện ngôn ngữ tự nhiên 10
2.1.2.Những nhược điểm của giao diện ngôn ngữ tự nhiên 11
2.2.Giao diện ngôn ngữ tự nhiên hạn chế 12
2.3.Kỹ thuật WYSIWYM editing 12
2.3.1.Các mô hình Editor 12
2.3.2.Kiến trúc WYSIWYM 15
2.3.3.Các thành phần cơ bản của một hệ thống WYSIWYM editing 17
PHẦN 3:HỆ THỐNG HỎI ĐÁP NGÔN NGỮ TỰ NHIÊN 19
3.1.Các hệ thống truy vấn cơ sở dữ liệu 19
3.2.Giới thiệu về một hệ thống CLEF 21
3.2.1. Ứng dụng của hệ thống 21
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
5
3.2.2. Kiến trúc của hệ thống 22
3.3.Giao diện CLEF 22
3.3.1.Chức năng và nhiệm vụ của giao diện CLEF 23
3.3.2.Mô hình hoá các văn bản trả lời 24
3.3.3.Cách thức tương tác giữa người dùng và giao diện CLEF 25
PHẦN 4:XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN
WYSIWYM 38
4.1.Phân tích thiết kế 38
4.1.1.Phân tích chức năng 38
4.1.2.Thiết kế cơ sở tri thức 40
4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor(liên kết) 40
4.1.2.2.Thiết kế logic 51
4.2.Cài đặt chương trình mô phỏng 65
4.2.1.Công cụ ngôn ngữ 65
4.2.2.Mã hoá chương trình 68
PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 94
5.1. Đánh giá kết quả 94
5.2.Hướng phát triển 95
Các tài liệu tham khảo 96
Phụ Lục
Danh mục các hình vẽ 3
Hình 2.1: Mô hình trao đổi giữa CSDL và người dùng qua giao diện NNTN 7
Hình 2.2:Kiến trúc của một giao diện ngôn ngữ tự nhiên 9
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
6
Hình 2.3:Mô hình kiến trúc của WYSIWYM 16
Hình 2.4 : Mô hình hoạt động của một hệ thống WYSIWYM 17
Hình 3.1: Kiến trúc chung của một hệ QA 20
Hình 3.2:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 1) 25
Hình 3.3:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 2) 26
Hình 3.4:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 3) 28
Hình 3.5:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 4) 29
Hình 3.6:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 5) 30
Hình 3.7:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 6) 31
Hình 3.8: Minh hoạ quá trình mở rộng văn bản 32
Hình 3.9:Tiến trình tương tác giữa người dùng và giao diện CLEF (trạng thái 7) 34
Hình 4.1: Tiến trình hoạt động của giao diện WYSIWYM 40
Hình 4.2:Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 1 59
Hình 4.3: Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 2 60
Hình 4.4:Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 3 61
Hình 4.5:Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 4 63
Hình 4.6:Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 5 65
Hình 4.7:Mạng ngữ nghĩa của A-box tương ứng với mô hình feedback text dạng 6 66
Hình 4.8 :Các thành phần thực thi chương trình 68
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
7
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
8
TÌM HIỂU KỸ THUẬT XÂY DỰNG GIAO DIỆN
NGƯỜI DÙNG VỚI CƠ CHẾ PHẢN HỒI NGÔN
NGỮ TỰ NHIÊN
PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ
NGÔN NGỮ TỰ NHIÊN TRONG THỰC TIỄN
Dẫn nhập:phần này sẽ giới thiệu chung về chủ đề của đồ án,lý do xuất phát
từ nhu cầu của thực tiễn và hướng nghiên cứu khoa học liên quan đến đồ án.
1.1.Giới thiệu
Ngày nay việc sử dụng máy tính đã trở nên hết sức phổ biến.Công nghệ thông
tin đã đi vào hầu hết các lĩnh vực của đời sống xã hội.Máy tính trở thành công cụ
đắc lực của nhiều người hoạt động trong các lĩnh vực khác nhau,nhất là trong việc
lưu trữ và xử lý một khối lượng dữ liệu chuyên ngành khổng lồ và không ngừng
tăng lên từng ngày.Máy tính giống như các công cụ khác là “cánh tay nối dài”, “tư
duy nối dài” của con người vì nó có thể đảm nhiệm những chức năng mà con
người tỏ ra khiếm khuyết,những năng lực mà con người cảm thấy khó khăn thì
máy tính lại chiếm ưu thế chẳng hạn như khả năng tính toán của con người dựa
trên hệ nhị phân là rất chậm so với khả năng tính toán của computer dựa trên hệ
nhị phân hay là bộ nhớ của con người không thể nào so sánh được với dung lượng
khổng lồ của các bộ nhớ máy tính.Song không phải vì vậy mà máy tính không có
sự hạn chế.Việc máy tính tỏ ra có nhiều ưu thế hơn con người ở một số lĩnh vực là
do nguyên lý hoạt động của máy tính khác với nguyên lý hoạt động của con
người.Chính điều này cũng là nguyên nhân của những hạn chế của máy tính,rõ
ràng là máy tính cũng thua con người trong nhiều lĩnh vực.Do đó để có thể phát
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
9
huy hiệu quả được các khả năng của con người và tận dụng hết khả năng của máy
tính đòi hỏi phải có sự “phối hợp” người và máy.Thực chất của quá trình phối hợp
này là con người sẽ chuyển giao những chắc năng mà con người còn “yếu” sang
cho máy tính đồng thời máy tính sẽ phải chuyển ngược trở lại cho con người
những thông tin và dữ liệu ở dạng đơn giản hiệu quả để con người có thể hiểu và
sử dụng trong công việc cũng như trong đời sống sinh hoạt hàng ngày. Để làm
được điều này đòi hỏi quá trình giao tiếp giữa người và máy phải luôn thông
suốt,thông tin hai chiều phải thật trong sang,tuy nhiên để người và máy hiểu được
nhau là rất khó vì như chúng ta biết máy tính chỉ là những thiết bị điện tử hoạt
động dựa trên những nguyên tắc logic và cơ chế vật lý của các thiết bị điện, điện
tử,ngôn ngữ của máy tính là ngôn ngữ của trạng thái, đó là trạng thái bật hay tắt
của một thiết bị,trạng thái điện áp cao hay điện áp thấp của các linh kiện điện tử là
những con số 0 và 1 luân phiên thay đổi nhau trong những thanh ghi dữ liệu vv
còn con người cùng với hoạt động sống của mình trong môi trường xã hội đã hình
thành nên ngôn ngữ của riêng mình với các ngôn ngữ rất đa dạng khác nhau của
nhiều dân tộc là những ngôn ngữ tự nhiên,mỗi loại ngôn ngữ tự nhiên có lịch sử
rất lâu đời con người tiếp nhận ngôn ngữ tự nhiên một cách dễ dàng (ai cũng có
thể biết nói biết viết ) nhưng đối với ngôn ngữ của máy tính thì con người muốn
nắm vững đòi hỏi mất rất nhiều thời gian và phải trải qua những quá trình nghiêm
ngặt.Nhưng những nhu cầu của thực tiễn bắt buộc con người phải tìm ra những
giải pháp tăng cường khả năng giao tiếp giữa người và máy tính.Chính vì vậy mà
những ứng dụng xử lý ngôn ngữ tự nhiên đã ra đời như một hướng đi để tìm ra câu
trả lời cho bài toán nói trên.
Tuy ngôn ngữ tự nhiên và ngôn ngữ máy có những sự khác biệt như đã phân
tích ở trên song chúng đều có một điểm chung là đều phải có cấu trúc và phải tuân
theo những trật tự nhất định,do đó chúng có thể “chuyển hoá” lẫn nhau.Khái niệm
chuyển hóa đây có nghĩa là ngôn ngữ tự nhiên có thể được thông dịch chuyển dần
qua các dạng trung gian theo từng bước,cuối cùng chuyển thành các định dạng nhị
Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi
ên
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46
10
phân của ngôn ngữ máy và máy có thể “hiểu” được.Nói chính xác là máy tính có
thể xử lý được đầu vào dạng ngôn ngữ tự nhiên và trả lại đầu ra cũng ở dạng ngôn
ngữ tự nhiên.Các bước trung gian này được đảm nhiệm bởi các chương trình ứng
dụng xử lý ngôn ngữ tự nhiên. Hiện nay các ứng dụng này đang rất phát triển theo
nhiều nhánh khác nhau.Một trong các nhánh đó là các ứng dụng giao diện ngôn
ngữ tự nhiên.Công việc xây dựng các ứng dụng này thuộc về đội ngũ những người
lập trình,các kỹ sư tri thức.Vì những lý do đó, là một sinh viên ngày tin học nên
người nghiên cứu chọn đề tài tập trung vào một hướng nghiên cứu về lĩnh vực xây
dựng giao diện ngôn ngữ tự nhiên như một bước đi để tiếp cận với ngành khoa học
nhiều triển vọng này.
1.2. Đặt vấn đề
1.2.1.Mục đích của đề tài :
Đề tài này nhằm nghiên cứu kỹ thuật xây dựng giao diện người dùng dựa trên cơ
chế phản hồi ngôn ngữ tự nhiên.
Nói đến giao diện người dùng tức là nói đến phần chương trình của ứng dụng sẽ
trao đổi tương tác trực tiếp với người dùng,nó là cơ chế trung gian trong quan hệ
giữa người dùng với ứng dụng và xa hơn nữa là máy tính.Thông thường hiện nay
phổ biến các loại giao diện người dùng đồ hoạ mang tính trực quan cao thuận tiện
cho việc sử dụng của người dùng tuy niên nó vẫn chưa đáp ứng được nhu cầu đặt
ra cho con người khi phải tiếp cận và xử lý những loại dữ liệu phức tạp có nội
dung tri tức chuyên sâu,những ưu điểm của các đặc trưng đồ hoạ không thể nào
giải quyết được vấn đề này vì với loại giao diện đồ hoạ thông thường con người
vẫn phải giao tiếp với máy tính theo những cách có vẻ hơi “cứng nhắc” do phải
khuôn mẫu theo những định dạng sẵn có, đó là những “chuẩn của máy” chứ không
phải là “chuẩn của con người” vì cái gần gũi và thông dụng nhất của con người
trong mọi quá trình giao tiếp vẫn là ngôn ngữ tự nhiên,một thứ công cụ bẩm sinh
của con người.Chính vì vậy hướng nghiên cứu của đề tài này là đi xa hơn một
bước trong việc xây dựng giao diện người dùng đồ họa bằng cách đưa ngôn ngữ tự
[...]... hồi ngôn ngữ tự nhiên trong các hệ thống hỏi đáp ngôn ngữ tự nhiên.Nội dung ứng dụng của kỹ thuật này sẽ được trình bày tiếp trong phần sau Đồ án tốt nghiệp 28 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp 29 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự. .. giao diện có hầu hết các ưu điểm của giao diện ngôn ngữ tự nhiên mà lại có ít nhược điểm nhất,thay vì xây dựng một giao diện ngôn ngữ tự nhiên theo hướng tiếp cận dựa trên cú pháp ta sẽ xây dựng một giao diện ngôn ngữ tự nhiên hạn chế (quasi Nl interface) dựa trên ngữ nghĩa Đồ án tốt nghiệp 20 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự. ..Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên nhiên vào trong giao diện người dùng đồ hoạ (Graphical user interface) thông qua việc cung cấp những phản hồi dạng ngôn ngữ tự nhiên (natural language feedback) trên giao diện đồ họa cho người dùng ,người dùng sẽ vừa làm việc với ứng dụng đồ hoạ vừa có thể thao tác trực tiếp trên giao diện này khi được các phản hồi ngôn. .. diện ngôn ngữ tự nhiên ,người ta xây dựng các giao Đồ án tốt nghiệp 19 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên diện ngôn ngữ tự nhiên hạn chế thay vì các giao diện ngôn ngữ tự nhiên truyền thống.Sự hạn chế ở đây không phải là sự hạn chế về tính năng của giao diện mà là sự hạn chế về miền ngôn ngữ tự nhiên cần xử lý theo nguyên... ngữ tự nhiên,nội dung của giao diện này được hiểu là giao diện xây Đồ án tốt nghiệp 11 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên dựng có dạng frame giống như các giao diện đồ hoạ thông thường tuy nhiên trên giao diện có các câu ngôn ngữ tự nhiên gọi là các feedback text người dùng có thể tương tác với giao diện dựa vào các feedback... các phần sau 2.1 .Giao diện ngôn ngữ tự nhiên(Natural language interface) Đồ án tốt nghiệp 12 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Các ứng dụng giao diện ngôn ngữ tự nhiên có nhiều loại khác nhau nhưng phổ biến nhất là các ứng dụng giao diện ngôn ngữ tự nhiên được nhúng vào các ứng dụng truy vấn và quản lý cơ sở dữ liệu Trong... các cách tiếp cận xây dựng giao diện ngôn ngữ tự nhiên hạn chế thì kỹ thuật WYSIWYM được đánh giá là một kỹ thuật hết sức hiệu quả ,kỹ thuật này được biết đến như một phương pháp xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 2.3 .Kỹ thuật WYSIWYM editing Kỹ thuật WYSIWYM được Richard Power đề xuất lần đầu tiên vào năm 1998 là một cách tiếp cận dựa trên ngữ nghĩa như vậy Lý do chọn... thế vượt trội của mình là giao diện dựa trên form.Tuy nhiên liệu đó có phải là lý do chính đáng hay không ,hay chẳng lẽ giao diện ngôn ngữ tự nhiên-NLI lại không có lợi ích gì Đồ án tốt nghiệp 14 Nguyễn Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Trong một giao diện ngôn ngữ tự nhiên điển hình dùng để truy nhập cơ sở dữ liệu( Natural language... Trung Thành-HTTT-K46 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Các ý tưởng sơ khai về xử lý ngôn ngữ tự nhiên được hình thành từ rất sớm vào khoảng những năm 1900 và được đề xuất biểu diễn ngôn ngữ tự nhiên bằng suy diễn toán học sử dụng logic.Những nghiên cứu này được công bố bởi Frege và Russell, Wittgenstein Họ đề xuất rằng ngôn ngữ tự nhiên là một hệ thống... Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Một bộ sinh ngôn ngữ tự nhiên (Natural language generators) sinh ra các văn bản đầu ra (output texts) từ một cơ sở tri thức đầy đủ (complete knowledge base),generator này sẽ sinh ra các feedback texts từ bất cứ trạng thái nào của cơ sở tri thức Một giao diện người dùng thể hiện quá trình tương tác giữa người dùng . hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên” Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi ên Đồ án tốt nghiệp. Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi ên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 1 Đề tài: “Tìm hiểu kỹ thuật xây dựng giao diện. Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhi ên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 7 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với
Ngày đăng: 25/03/2014, 06:21
Xem thêm: Đề tài: “Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên” doc, Đề tài: “Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên” doc