Lý thuyết biểu diễn diễn ngôn

82 731 0
Lý thuyết biểu diễn diễn ngôn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - VŨ THỊ HƯƠNG LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - VŨ THỊ HƯƠNG LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN Chuyên ngành: Cơ sở toán học cho tin học Mã số: 60460110 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Nguyễn Thị Minh Huyền Hà Nội – Năm 2014 MỤC LỤC LỜI CẢM ƠN GIỚI THIỆU CHƯƠNG CƠ SỞ TOÁN HỌC 10 1.1 LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT 10 1.1.1 Các khái niệm 10 1.1.2 Các khái niệm ngữ nghĩa 11 1.1.3 Phép hợp (Unification) 12 1.2 TÍNH TOÁN LAMBDA 14 1.2.1 Cú pháp tính toán lambda 15 1.2.2 Biến tự biến ràng buộc 16 1.2.3 Các phép biến đổi 17 CHƯƠNG LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN 21 2.1 CÁC THÀNH PHẦN CƠ BẢN CỦA DRT 21 2.1.1 Tổng quan DRT 21 2.1.2 Cách xây dựng cấu trúc biểu diễn diễn ngôn 24 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN 27 2.2.1 Ngôn ngữ DRS mở rộng bậc 27 2.2.2 Ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin khả thay đổi ngữ cảnh 32 2.2.3 Các lượng từ 40 2.2.4 Số nhiều 41 2.2.5 Thời thể 45 2.3 TIỀN GIẢ ĐỊNH (PRESUPPOSITION) 49 2.3.1 Ý nghĩa tiền giả định 49 2.3.2 Một ví dụ 50 CHƯƠNG BIỂU DIỄN DIỄN NGÔN VỚI THAM CHIẾU THỜI GIAN TRONG TIẾNG VIỆT 55 3.1 ĐỊNH VỊ THỜI GIAN 55 3.1.1 Biểu diễn thời gian mối quan hệ với không gian 55 3.1.2 Định vị thời gian 58 3.2 YẾU TỐ THỜI TRONG TIẾNG VIỆT 69 3.2.1 Các quan niệm thời tiếng Việt 69 3.2.2 Cách diễn đạt ý nghĩa thời tiếng Việt 70 3.3 DẤU HIỆU TỪ VỰNG ĐỂ NHẬN BIẾT THỜI TRONG TIẾNG VIỆT 73 KẾT LUẬN 79 TÀI LIỆU THAM KHẢO 80 DANH MỤC HÌNH VẼ Hình 1: Cây cú pháp biểu thức lambda 16 Hình 2: Phân tích cú pháp kết hợp tính toán lambda câu (2) 20 Hình 3: Thời gian biểu diễn theo định hướng không gian 55 Hình 4: Định vị thời gian với ẩm dụ người quan sát đứng yên 56 Hình 5: Định vị thời gian với ẩm dụ người quan sát chuyển động 56 DANH MỤC TỪ VIẾT TẮT Cụm từ đầy đủ Cụm từ viết tắt BV Bound variables CCG Combinatory Categorial Grammar CCP Context change potential DRT Discourse representation theory DRS Discourse representation structure EKAW Knowledge Engineering and Knowledge Management FV Free variables NP Noun phrase LỜI CẢM ƠN Đầu tiên em xin gửi lời cảm ơn chân thành sâu sắc tới TS Nguyễn Thị Minh Huyền bảo, hướng dẫn tận tâm cho em suốt trình thực luận văn Việc hoàn thành luận văn không kể tới hỗ trợ tạo điều kiện Viện Công nghệ thông tin, Viện Khoa học Công nghệ quân sự, Bộ Quốc Phòng quan công tác Tôi xin trân trọng gửi lời cảm ơn tới thủ trưởng, đồng nghiệp, đồng chí Bên cạnh đó, em xin cảm ơn thầy cô, cán nhân viên Bộ môn Tin học nói riêng khoa Toán – Cơ – Tin học, trường Đại học Khoa học Tự nhiên nói chung tận tình dạy dỗ giúp đỡ em từ em sinh viên trường đến năm em trở lại học tập, nghiên cứu khoa với cương vị học viên cao học Tôi xin cảm ơn gia đình, bạn bè tất người quan tâm, tạo điều kiện, động viên cổ vũ để hoàn thành nhiệm vụ Luận văn không tránh khỏi thiếu sót hạn chế thời gian thực hiểu biết thật hệ thống ngữ pháp, ngữ nghĩa tiếng Việt Tôi mong nhận ý kiến đóng góp thầy cô bạn Hà Nội, tháng 11 năm 2014 Học viên Vũ Thị Hương GIỚI THIỆU Sự chi phối ngữ cảnh ngôn ngữ tự nhiên tượng thiên biến vạn hóa vô phức tạp, khiến nhiều nhà ngôn ngữ ngữ nghĩa dày công nghiên cứu Trước đây, quan niệm ngữ nghĩa tắc coi lý thuyết ngữ nghĩa mối quan tâm bản, khái niệm trọng tâm thông tin thật, ý nghĩa câu điều kiện thật mà khả thay đổi thông tin Khi nhà nghiên cứu trọng vào phụ thuộc ngữ cảnh ngôn ngữ mô thức xử lý toán ngữ nghĩa có thay đổi lớn, lý thuyết ngữ nghĩa động thiết kế đặc thù để làm việc với mối tương quan phát ngôn ngữ cảnh phản ánh thay đổi Tuy nhiên, quan hệ thông tin thật có vị trí tối quan trọng thành phần định tất lý thuyết động Trong hai thập kỷ gần đây, lý thuyết ngữ nghĩa động phát triển mạnh mẽ, xoay quanh vấn đề cốt lõi mô tả phụ thuộc ngữ cảnh vào ngữ nghĩa [10] Đó đặc tính có ngôn ngữ tự nhiên tương tác có tính đối ứng Ta kể đến vài lý thuyết ngữ nghĩa động như: - Năm 1991 Groenendijk Stokhof đưa văn phạm Montague động dựa vào logic vị từ - Năm 1991 Chierchia nghiên cứu mối liên kết động tượng thay đại từ - Năm 1996 Kohlhase đưa lý thuyết tính toán ngữ nghĩa dựa vào tính toán lambda - Năm 1997 Eijck Kamp đề xuất cách biểu diễn diễn ngôn ngữ cảnh có Các công cụ biểu diễn ngữ nghĩa động phát triển rộng rãi như: - Named Entity Recognition (Nhận biết tên thực thể): Công cụ xác định cụm từ văn biểu diễn tên người, cụm từ biểu diễn vị trí hay tổ chức,… - Wikifier: Công cụ xác định thực thể khái niệm quan trọng văn bản, xử lý tượng mập mờ nghĩa liên kết tới trang Wikipedia - Context-Sensitive Spelling Correction (Sửa lỗi từ dựa vào ngữ cảnh): Công cụ tìm gợi ý cách sửa cho lỗi sai nghĩa - Co-reference Resolution (Giải đồng tham chiếu): Một thực thể nhắc đến văn theo nhiều cách khác Công cụ phát cụm từ thể thực thể - Context Sensitive Verb Paraphrasing (Chú thích động từ dựa ngữ cảnh): Công cụ phân loại xem xét động từ v ngữ cảnh với động từ ứng viên u, đồng thời xác định ngữ cảnh cho u thay cho v để giữ nguyên ý nghĩa văn không Chúng ta tham khảo minh họa trực tuyến công cụ trang http://cogcomp.cs.illinois.edu/page/demos/ Lý thuyết biểu diễn diễn ngôn (DRT: Discourse Representation Theory) nằm phạm vi ngữ nghĩa động, khác biệt chỗ vai trò bật thật phát ngôn Một công cụ tiêu biểu dựa DRT Boxer Johan Bos phát triển Với đầu vào CCG (Combinatory Categorial Grammar: văn phạm danh mục kết nối), Boxer cho cấu trúc biểu diễn diễn ngôn (tham khảo minh họa http://svn.ask.it.usyd.edu.au/trac/candc/wiki/Demo) Một công trình khác Valentina Presutti, Francesco Draicchio Aldo Gangemi công bố hội thảo quốc tế EKAW 2012 đưa phương pháp kết hợp DRT với mẫu thể học để trích xuất tri thức [13] Luận văn nghiên cứu DRT với mục đích tạo tiền đề lý thuyết cho ứng dụng biểu diễn diễn ngôn tiếng Việt Cấu trúc luận văn gồm ba phần: Chương trình bày sở toán học sử dụng cho chương sau, bao gồm logic vị từ cấp một, tính toán lambda phép toán hợp xử lý ngôn ngữ Đây công cụ để biểu diễn tính toán ngữ nghĩa Chương hai trình bày lý thuyết biểu diễn diễn ngôn Phần đầu chương giới thiệu cách xây dựng cấu trúc biểu diễn diễn ngôn phương tiện để biểu diễn diễn ngôn cách thể yếu tố cú pháp cấu trúc Mô hình tiền giả định trình bày phần sau Các kết luận ví dụ minh họa áp dụng cho tiếng Anh Chương ba khảo sát cách định vị thời gian phương thức thể yếu tố thời phát ngôn tiếng Việt Từ có nhận xét cách chọn thời gian tham chiếu phù hợp thể trọn vẹn yếu tố thời biểu diễn diễn ngôn tiếng Việt - giờ: * khoảng thời gian khứ tương lai + tố thời gian kiện xảy thời tương lai Ví dụ: (61) Làm cho rõ mặt phi thường Bấy ta rước nàng nghi gia (Nguyễn Du) + tố thời gian kiện xảy thời khứ Ví dụ: (62) Bấy có thần Đế Lai thuộc giòng giống Thần Nông đưa em gái Âu Cơ sang thăm đất Lạc (Truyện Sự tích trăm trứng) - bao giờ: * Với ý nghĩa lúc ….cũng…, dùng làm tố thời gian kiện kéo dài từ khứ đến (63) …, câu chuyện lũ trẻ bên làm cho bà lão bên lên tiếng (Nguyễn Thi) * Trong câu giả định, với ý nghĩa mà…, dùng làm tố thời gian kiện xảy thời tương lai phiếm định (64) Bao trở lại đồng Bương Cấn Về núi Sài Sơn ngó lúa vàng Sông Đáy chậm nguồn qua Phủ Quốc Sáo diều khua khoắt thổi đêm trăng (Quang Dũng) Các đại từ hỏi thời gian: - bao giờ: Trong kiểu câu / C –V, di chuyển từ vị trí trước kết cấu C –V sang vị trí sau kết cấu C –V yêu cầu nhấnmạnh vào ý nghĩa mà yêu cầu diễn đạt ý nghĩa đối lậpvề thời gian, tạo thành đối lập thời gian: tương lai >< khứ 67 Thời gian kiện trường hợp phiếm định Ví dụ: (65) Đến anh đứng em Trước biển lớn đời thương cảm ấy? (Vũ Quần Phương) (Tương lai) (66) - Anh Hà Nội bao giờ? (Quá khứ) Trợ từ việc định vị thời gian: Trong tiếng Việt, trợ từ khảo sát bao gồm: nghe, nghe, nhé, cho mà xem, cho biết tay, đã, mà Các trợ từ nghe, nghe, có ý nghĩa yêu cầu, dấu hiệu cho biết kiện chưa xảy ra, nghĩa kiện xảy tương lai Các trợ từ cho mà xem, cho biết tay nhấn mạnh tác động không hay, phải chịu đựng việc xảy có tính chất đe dọa dấu hiệu cho biết kiện câu chưa xảy ra, nghĩa kiện câu xảy tương lai Trợ từ biểu thị kiện vừa nói đến cần hoàn thành trước làm việc khác vậy, có ý nghĩa làm cho kiện câu phát ngôn chưa xảy ra; nói cách khác, kiện xảy tương lai Trợ ngữ mà biểu thị thái độ phàn nàn, trách móc không chấp thuận việc làm tại, lúc nói Tiếng Anh trợ từ Tiếng Anh có hình thái câu cầu khiến có ý nghĩa tương đương, thời động từ chia Sau số ví dụ: (67) - Ông sếp ơi, cho cắt cỏ nghe! (Nguyễn Thi) (68) - Cô Loan, cô vào uống nước, ăn trầu (Nhất Linh) (69) Bà Lí xung tiết: -Ăn mà (Nguyễn Công Hoan) 68 (70) Come in, please! (71) Would you like some tea? 3.2 YẾU TỐ THỜI TRONG TIẾNG VIỆT 3.2.1 Các quan niệm thời tiếng Việt Tiếng Việt có phạm trù thời hay không? Đây câu hỏi chưa có câu trả lời quán nhà Việt ngữ Trong thời gian dài, người ta cho ba “đã”, “đang”, “sẽ” ba tố thời tiếng Việt Ngay sách giáo khoa dạy tiếng Việt cho người nước Khoa Việt ngữ trường Đại học Ngoại ngữ, Đại học Quốc gia Hà Nội biên soạn viết tiếng Việt có ba thì: khứ, tương lai, đánh dấu ba tố “đã”, “đang” “sẽ” [4] Song cần khảo sát số ví dụ đơn giản như: (72) Hôm qua em làm gì? Em xem phim với lũ bạn (73) Bây cháu đâu đấy? Cháu xem phim bà (74) Ngày mai xem phim mẹ Ta thấy ý nghĩa khứ, tương lai biểu thị rõ câu mà không cần có mặt tố Hơn nữa, đưa chúng vào, câu tiếng Việt trở thành gượng ép, khó chấp nhận (72’) Hôm qua em làm gì? - Em xem phim với lũ bạn (73’) Bây cháu đâu đấy? - Cháu xem phim bà (74’) Ngày mai xem phim mẹ Hiện tồn hai trường phái đối lập Một trường phái khẳng định tiếng Việt có phạm trù thời thể, tiêu biểu Nguyễn Minh Thuyết [6] ông cho rằng: “Thời thể hai phạm trù ngữ pháp thật tiếng Việt” Trường phái thứ hai, ngược lại, phủ nhận tồn phạm trù thời 69 tiếng Việt Tiêu biểu cho trường phái Cao Xuân Hạo [4], Nguyễn Đức Dân [1] Luận văn trình bày theo trường phái cho tiếng Việt phạm trù thời, tức tiếng Việt không ngữ pháp hóa thời hình thái ngữ pháp bắt buộc động từ, song tiếng Việt hoàn toàn có khả diễn đạt ý nghĩa thời cần thiết Sau luận văn đưa cách diễn đạt ý nghĩa thời tiếng Việt sở phân tích liệu thu thập trình nghiên cứu 3.2.2 Cách diễn đạt ý nghĩa thời tiếng Việt * Trong tiếng Việt, thời không đánh dấu hình thái ngữ pháp Các động từ đưa vào môi trường câu không thay đổi hình thái, diễn đạt kiện khứ, tương lai, chẳng hạn ví dụ (72)-(74) mà quan sát Đứng phương diện ý nghĩa thời gian, cần phải định vị kiện thời gian, tiếng Việt sử dụng phương tiện từ vựng, tức dùng khung đề có ý nghĩa từ vựng tương ứng cho khứ hôm trước, hôm qua, ngày xưa, trước đây, lúc cho bây giờ, hôm nay, lúc này, cho tương lai thường dùng từ mai này, mai, sau này, ngày mai, hai tháng Các khung đề diễn đạt ý nghĩa tương ứng với ý nghĩa diễn đạt thời khứ hay tiếng Anh, kể tính chất trực tức định vị kiện so với thời điểm phát ngôn Chúng ta khảo sát số đoạn trích từ truyện ngắn tác phẩm văn học Việt Nam sau: (75) Hôm sinh nhật gái (Nguyễn Thị Thu Huệ, Hậu thiên đường) 70 (76) Năm trước lần phép thăm nhà, thiếu tướng lấy làm thấy Bạch Ngọc thường hay lặng lẽ vào rừng sâu lúc xế chiều (Nguyễn Dậu, Con thú bị ruồng bỏ, trích Truyện ngắn chọn lọc, Nxb Hà nội) (77) Mai mười hai cháu tầu Vinh hả? (Ma Văn Kháng, Quê nội, trích Truyện ngắn chọn lọc, Nxb Hà nội) Các ví dụ trích dẫn cho thấy tiếng Việt dùng khung đề tương ứng với tại, khứ tương lai để định vị kiện xảy khung đề đó, thân kiện không mang dấu ấn thời Hơn nữa, tiếng Việt không cần dùng tố đã, đang, để định vị thời vào ba khung khứ, tương lai Chúng ta thấy ví dụ trên, đưa tố vào, câu trở nên khó chấp nhận nghĩa bị biến đổi (75’) Hôm sinh nhật gái (76’) Năm trước lần phép thăm nhà, thiếu tướng lấy làm thấy Bạch Ngọc thường hay lặng lẽ vào rừng sâu lúc xế chiều (77’) Mai mười hai cháu tầu Vinh hả? Còn câu (77) câu hỏi khẳng định “Đi tầu” kiện dự liệu trước nằm kế hoạch mà người nói người nghe biết Nói cách khác, kiện tiền giả định (77’) mang ý nghĩa giả thiết nhiều tính thực hóa kiện có khả thực Trong ngôn hội thoại, ngữ cảnh cho phép định vị kiện vào khung thời gian so với thời điểm phát ngôn tiếng Việt không cần thiết phải diễn đạt ý nghĩa thời gian, tức không cần dùng khung thời gian Chúng ta quan sát ví dụ sau: 71 (78) Bà ơi, bà mua túi cho cháu bà? (79) Chào cụ, cụ ạ? Ngữ cảnh phát ngôn (78) cho thấy tiền giả định người bà mua túi phải thỏa mãn Trong ngôn ngữ có phạm trù thời tiếng Anh, ý nghĩa phải mã hóa dạng thức động từ, thời khứ: (78’) Did you buy this wallet for me, grandma? Nhưng tiếng Việt không cần diễn đạt ý nghĩa thời gian rõ nhờ ngữ cảnh Tiếng Việt không cần dùng từ để biểu thị kiện diễn thời điểm phát ngôn câu (79) lẽ người nói đặt câu hỏi cho người đối thoại hai người đường gặp đường Thực tế, đặt câu hỏi này, người Việt Nam không quan tâm đến địa điểm mà người đối thoại với đến, đến hành độnh mà người làm mà thực chất câu hỏi thay cho lời chào giao tiếp người Việt Nam Các ví dụ cho thấy ttếng Việt không thiết phải biểu thị ý nghĩa thời không cần thiết phải định vị kiện thời gian Các tố đã, đang, sẽ,… tố biểu thị phạm trù thời tiếng Việt Vậy đã, đang, đóng vai trò tiếng Việt chúng xuất câu? Trong phần tiếp theo, phân tích ngữ cảnh cho phép có mặt từ để làm bật hoạt chức chúng ý nghĩa mà chúng truyền tải ngữ cảnh * Ba tiểu từ đã, đang, tố biểu thị thời khứ, tương lai nhiều người lầm tưởng Chúng nằm nhóm tiểu từ thể tình thái tiếng Việt 72 - Đã tiểu từ đa nghĩa Nó thường xuất ngữ cảnh có đối lập hai giá trị bình diện chủ quan người nói - Đang tiểu từ mang ý nghĩa rõ rệt thể Nó tiếp diễn mang ý nghĩa tạm thời kiện định vị khung đề khứ, tương lai - Sẽ xuất hầu hết phát ngôn có khung đề tương lai song không tương lai mà tiểu từ biểu thị tình thái tiếng Việt Các kiện kết hợp với thường kiện chưa thực hóa thực tế mà tồn ý nghĩ, dự đoán, giả thiết dạng lời hứa người nói Vì vậy, tiểu từ dùng để phân biệt thể thực thể phi thực tiếng Việt 3.3 DẤU HIỆU TỪ VỰNG ĐỂ NHẬN BIẾT THỜI TRONG TIẾNG VIỆT Trong phần này, luận văn liệt kê dấu hiệu nhận biết thời tiếng Việt từ vựng cho ba thời khứ, tại, tương lai dựa vào khảo sát tiếng Việt Nhận biết thời từ vựng, đặc biệt trạng từ thời gian có sức mạnh định tiếng Việt tiếng Anh Trong tiếng Anh, thời động từ lại chia cụ thể hơn, ví dụ thời khứ có khứ đơn, khứ hoàn thành, khứ hoàn thành tiếp diễn,… Như trường hợp cần đối sánh tương đồng hai ngôn ngữ ta cần dựa thêm vào yếu tố ngữ cảnh khác tiền giả định tri nhận tự nhiên, tình thái diễn ngôn, 73 * Thời khứ tiếng Việt - Định vị thời gian phía sau: diễn ngôn có xuất từ vựng thể thời gian qua qua, rồi, đằng sau, qua rồi, phía sau,… - Phụ từ: vừa mới, vừa xong, từng, có rồi,… - Vị từ: + nhóm vị từ bị động được, bị, phải, trót,… + nhóm vị từ tồn tại, sinh, mất: sinh ra, mất, chết,… - Trạng từ: trước kia, trước đây, thưở trước, cách đây, giờ, bao giờ, hôm trước, hôm qua, ngày xưa, trước đây, lúc nãy,… Ví dụ ta xây dựng DRS cho câu sau: (80) Bác Hồ sinh Nghệ An n x z e tloc Bác-Hồ(x) “Nghệ-An”(z) tloc ⊰ n e ⊆ tloc e: sinh-tại(x,z) * Thời tiếng Việt - Định vị thời gian tại: ngày nay, lúc này,… - Phụ từ: ngày nay, nay,… - Trạng từ: dạo này, hôm nay, lúc này,… - Đại từ: bây giờ, giờ, bao giờ,… 74 - Trợ từ: mà thế,… Ví dụ ta xây dựng DRS cho câu sau: (81) Bây nàng nhớ anh n x z e tloc nàng(x) anh(z) tloc = n e ⊆ tloc e: nhớ(x,z) * Thời tương lai tiếng Việt - Định vị thời gian tương lai: phía sau,… - Phụ từ: sắp, sẽ,… - Vị từ: + muốn, toan, nên, định, chực, cần, thèm vào, phải, dám, thà, suýt, có thể, không thể,… + mong, mong mỏi, mong muốn, ước ao, ước nguyện, ước muốn, mơ ước, khát khao, chúc, hứa, thề, nguyện, cậy, định,… - Trạng từ: mai, giờ, bao giờ, mai này, sau này, ngày mai, hai tháng nữa,… - Trợ từ: nghe, nghe, nhé, cho mà xem, cho biết tay, đã,… 75 Ví dụ ta xây dựng DRS cho diễn ngônsau: (82) Em chợ chồng Chồng nhà phơi quần áo n x t e1 z t e2 em(x) n ⊰ t1 e1 ⊆ t1 e1: đi-chợ(x) t1 ⊰ t2 chồng(z) n ⊰ t2 e2 ⊆ t2 e2: phơi-quần-áo(x) Ta xét thêm ví dụ khó hơn: (83) Hương ngồi sửa luận văn Hôm qua chị bảo vệ Sau buổi bảo vệ gái chị sốt cao Tết đến nơi Chị vừa chăm vừa cố gắng sửa xong để ăn tết cho ngon Ta kí hiệu câu (83) S1, S2, …, S5 S1 thời thể tiếp diễn Trong ngữ cảnh S1 cung cấp, S2 thời khứ với trạng từ “hôm qua” DRS biểu diễn ngữ nghĩa cho S1 S2 sau: n h c t s1 j t e Hương(h) “luận-văn”(c) t1 = n t ⊆ s1 s1: PROG(^e:ngồi-sửa(h,c)) t2 ⊰ n DAY(ty) ty ⫗DAY-OF(n) t2 ⊆ ty e2 ⊆ t2 e2: bảo-vệ(h,c) 76 Ở ta sử dụng quan hệ nối đầu (abutment), ký hiệu ⫗ Với hai khoảng thời gian t1 t2, t1⫗ t2 ⇔ t1 ⊰ t2 ∄ t3: (t1 ⊰ t3)^ (t3 ⊰ t2) S3 chứa kiện e3 sau kiện S2 kéo dài đến tại, thời gian định vị S2 làm thời gian tham chiếu biểu diễn cho S3 DRS khởi tạo biểu diễn cho S3 sau: g e3 t3 treg con-gái(g,h) t3 ⊰ n t2 ⫗ treg t3 ⊆ treg t3 ⊆ e3 e3: “sốt-cao”(g) S4 có kiện thời tương lai Câu cuối S5 thời trước thời điểm “tết” Vì hành động “sửa xong” luận văn phải xảy trước tết chủ thể “ăn tết cho ngon” DRS biểu diễn S4 S5 sau: t4 e5 t5 e5’t5’ e5’’ t5’’ “Tết”(t4) n ⊰ t4 t5 = n t5 ⊆ e5 e5: “chăm”(h,g) n ⊰ t5’ t5’ ⊰ t4 t5’ ⊆ e5’ e5’: sửa-xong(h,c) t5’’ ⊆ t4 e5’’ ⊆ t5’’ e5’’:”ăn-tết-cho-ngon”(h) Kết hợp lại ta DRS biểu diễn cho câu ví dụ (83) là: 77 n h c g t1 s1 t2 e2 t3 e3 treg t4 e5 t5 e5’t5’ e5’’ t5’’ Hương(h) “luận-văn”(c) t1 = n t ⊆ s1 s1: PROG(^e:ngồi-sửa(h,c)) t2 ⊰ n DAY(ty) ty ⫗DAY-OF(n) t2 ⊆ ty e2 ⊆ t2 e2: bảo-vệ(h,c) con-gái(g,h) t3 ⊰ n t2 ⫗ treg t3 ⊆ treg t3 ⊆ e3 e3: “sốt-cao”(g) “Tết”(t4) n ⊰ t4 t5 = n t5 ⊆ e5 e5: “chăm”(h,g) n ⊰ t5’ t5’ ⊰ t4 t5’ ⊆ e5’ e5’: sửa-xong(h,c) t5’’ ⊆ t4 e5’’ ⊆ t5’’ e5’’:”ăn-tết-cho-ngon”(h) * Tổng kết Trong chương luận văn so sánh cách định vị thời gian thể yếu tố thời động từ tiếng Anh tiếng Việt Tiếng Việt hình thái ngữ pháp thể yếu tố thời tiếng Anh mà chủ yếu sử dụng từ vựng để nhận biết thời động từ, kết hợp với ngữ cảnh phát ngôn liên quan Khi biểu diễn diễn ngôn tiếng Việt, ta cần tận dụng phương tiện từ vựng để định vị thời gian, từ có biểu diễn ngữ nghĩa 78 KẾT LUẬN Lý thuyết biểu diễn diễn ngôn cho tiếng Anh (có so sánh với tiếng Việt) với thuyết tiền giả định chủ đề luận văn Trong đó, việc biểu diễn ngữ nghĩa ngôn ngữ tự nhiên công thức logic vị từ cấp tính toán lambda sở quan trọng Trong phần trình bày lý thuyết biểu diễn diễn ngôn, luận văn trình bày cách sử dụng cấu trúc biểu diễn diễn ngôn để thực biểu diễn diễn ngôn với minh họa tiền giả định Bên cạnh đó, qua ngôn ngữ DRS mở rộng bậc một, luận văn trình bày khái niệm mô hình hóa ngữ cảnh ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin, khả thay đổi ngữ cảnh cách thức tích hợp yếu tố ngữ pháp (thời thể, lượng từ, thể số nhiều) vào ngữ cảnh biểu diễn diễn ngôn Luận văn có đưa khảo sát yếu tố thời thể tiếng Việt Từ luận văn có so sánh với tiếng Anh để áp dụng biểu diễn diễn ngôn yếu tố thời tiếng Việt Việc biểu diễn ngữ nghĩa ngôn ngữ tự nhiên thành cấu trúc DRT thực có ý nghĩa vô quan trọng, sở cho nhiều toán ứng dụng xử lý ngữ nghĩa Đặc biệt thuyết tiền giả định có khả nắm bắt hiệu ngữ cảnh diễn ngôn Trong thời gian tới, nghiên cứu chi tiết cách biểu diễn diễn ngôn cho trạng từ thời gian nói riêng trạng từ nói chung tiếng Việt mở rộng nghiên cứu lý thuyết biểu diễn diễn ngôn cho tiếng Việt cách thức thể yếu tố cú pháp khác thời thể số nhiều 79 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt (1) Nguyễn Đức Dân (1996), Nhận diện thời gian tiếng Việt, Tạp chí Ngôn ngữ số 3, Viện Ngôn ngữ học (2) Đỗ Đức Giáo (2008), Toán rời rạc, Nhà xuất Giáo dục (3) Nguyễn Văn Hán (2012), Định vị thời gian tiếng Việt góc nhìn ngôn ngữ học tri nhận (so sánh với tiếng Anh), Luận án tiến sĩ Ngôn ngữ học, Trường Đại học Khoa học Xã hội Nhân văn, Đại học Quốc gia Thành phố Hồ Chí Minh (4) Cao Xuân Hạo (1998), Về ý nghĩa “thì” “thể” tiếng Việt, Tạp chí Ngôn ngữ số 5, Viện Ngôn ngữ học (5) Vũ Thị Ngân (2003), Phạm trù thời thể tiếng Pháp tiếng Việt, Đề tài cấp Đại học Quốc gia Hà Nội, Trường Đại học Ngoại ngữ, Đại học Quốc gia Hà Nội (6) Nguyễn Minh Thuyết (1998), Thành phần câu tiếng Việt, Nhà xuất Đại học Quốc gia Hà Nội Tài liệu tiếng Anh (7) A Burchardt, S Walter, A Koller, M Kohlhase, P Blackburn, J Bos (2002), Computational Semantics, MiLCA, Department of Computerlinguistic, Saarlandes Saarbrucken University, Germany 80 (8) A Martelli, U Montanari (1982), An Efficient Unification Algorithm, Journal: ACM Transactions on Programming Languages and Systems, New York, USA (9) F Baader, W Snyder (2001), Unification Theory, Elsevier Science Publishers (10) H Kamp, Josef van Genabith, Uwe Reyle (2011), Discourse Representation Theory, An Updated Survey In: D Gabbay (ed.), Handbook of Philosophical Logic, 2nd ed., Vol XV (11) K von Fintel, Irene Heim (2011), Intensional Semantics, MIT Spring (12) P Selinger (2007), Lecture Notes on the Lambda Calculus, Department of Mathematics and Statistics, Dalhousie University, Halifax, Canada (13) V Presutti, Francesco Draicchio, Aldo Gangemi (2012), Knowledge extraction based on discourse representation theory and linguistic frames, EKAW'12 Proceedings of the 18th international conference on Knowledge Engineering and Knowledge Management, Springer-Verlag Berlin, Heidelberg 81 [...]... ta sẽ tìm hiểu các kỹ thuật xử lý ở mức cao hơn trong lý thuyết biểu diễn diễn ngôn Nói riêng về tính toán lambda, đây là công cụ nền để tính toán ngữ nghĩa Khi biểu diễn câu bằng các biểu thức logic vị từ, tính toán lambda giúp định vị biến Khi xây dựng các chương trình ứng dụng lý thuyết biểu diễn diễn ngôn, tính toán lambda không thể thiếu trong các biểu thức biểu diễn ngữ nghĩa để thực hiện việc... CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN Với các công cụ toán học đã nêu ở chương trước, ta có thể biểu diễn một câu trong văn bản qua các công thức logic Trong chương này ta sẽ xây dựng biểu diễn cho một diễn ngôn gồm nhiều câu liên tiếp, trong đó các câu có liên quan với nhau về mặt ý nghĩa trong ngữ cảnh chung Lý thuyết biểu diễn diễn ngôn (DRT: Discourse Representaion Theory) là công cụ xử lý tốt các... nghĩa 2.1.2 (Cấu trúc biểu diễn diễn ngôn) Cấu trúc biểu diễn diễn ngôn là một cấu trúc dữ liệu gồm hai thành phần: - Tập các tham chiếu diễn ngôn U (còn gọi là “không gian” của DRS), - Tập các điều kiện Con, mô tả các ràng buộc giữa các tham chiếu Trong cấu trúc biểu diễn diễn ngôn, tập tham chiếu diễn ngôn cho ta thông tin về các đối tượng được nhắc đến trong diễn ngôn còn tập điều kiện... cho diễn ngôn DRT giải quyết được tình huống trên DRT có sử dụng một công cụ để cấu trúc hóa diễn ngôn, đó là cấu trúc biểu diễn diễn ngôn (DRS: discourse representation structure) Ta có các định nghĩa sau: 21 Định nghĩa 2.1.1 (Tham chiếu diễn ngôn) Tham chiếu diễn ngôn là các thực thể được nhắc đến trong diễn ngôn mà sau đó có thể dùng đại từ để tham chiếu lại Trong ví dụ (3) có hai tham chiếu diễn ngôn. .. => DRS K1,2,…,n 22 Cách thức xử lý như vậy thể hiện phần ngữ nghĩa động của DRT Mỗi bước trên đều trải qua hai giai đoạn: - Xây dựng biểu diễn ngữ nghĩa thông qua cấu trúc biểu diễn diễn ngôn (DRS) từ diễn ngôn đầu vào - Tạo mô hình biểu diễn cho các cấu trúc biểu diễn diễn ngôn đó Đầu những năm 1990, Van Der Sandt và Geurts đề xuất cấu trúc DRT mới dựa trên cách xử lý ngữ nghĩa tổng quát bằng tiền... mới xây dựng biểu diễn theo hướng từ dưới lên: các biểu diễn khởi tạo được xây dựng từ các cây phân tích cú pháp bằng cách gán các biểu diễn ngữ nghĩa cho các lá, sau đó xây dựng các biểu diễn cho các thành phần phức tạp bằng cách kết nối các biểu diễn của các phần cú pháp liền kề Luận văn chú trọng mô tả phiên bản DRT mới 2.1.2 Cách xây dựng cấu trúc biểu diễn diễn ngôn Gần đây hướng xử lý từ dưới lên... lên để xây dựng cấu trúc biểu diễn diễn ngôn (áp dụng cho phiên bản DRT mới dựa trên tiền giả định) Thuật toán gồm hai trạng thái - Trạng thái đầu khởi tạo biểu diễn cho các câu trong đó tiền giả định được thể hiện rõ ràng trong DRS Biểu diễn khởi tạo đơn giản nhất có dạng trong đó DRS D là phần biểu diễn không có tiền giả định còn P là tập tất cả các biểu diễn (các biểu diễn này có thể có dạng... cho ngôn ngữ DRS đơn giản L vừa định nghĩa ở trên cho các mô hình bậc nhất Định nghĩa 2.2.9 (Hàm biểu diễn của mô hình) Hàm biểu diễn F cho các mô hình của L được định nghĩa như sau: (i) (ii) Biểu diễn theo lý thuyết mô hình của ngôn ngữ DRS vừa định nghĩa ở trên có thể minh họa như sau: Ta có thể coi một DRS K = là một mô hình “thành phần” biểu diễn thông tin trong diễn ngôn D nào... đích của ngữ nghĩa lý thuyết mô hình là giải thích ý nghĩa dưới dạng các điều kiện sự thật và tham chiếu Mục đích này được thực hiện qua một thủ tục gồm hai bước: - Biểu diễn ngôn ngữ đối tượng được gán một dạng logic hoặc biểu diễn ngữ nghĩa” – một biểu diễn phụ thuộc vào một số ngôn ngữ chuẩn tắc - Ta cho trước định nghĩa lý thuyết mô hình về các điều kiện sự thật cho các biểu diễn ngữ nghĩa dạng... kết quả: Như vậy ta đã xây dựng xong cấu trúc diễn ngôn cho câu (3) 26 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN Trong phần này chúng ta đưa ra một số định nghĩa chính tắc về cú pháp và ngữ nghĩa của một một ngôn ngữ DRS cơ bản Phần đầu giới thiệu ngôn ngữ DRS mở rộng bậc một, biểu diễn một mô hình ngôn ngữ chủ đích và định nghĩa khái niệm mệnh đề được biểu diễn bởi một DRS trong thế giới giả định Tuy nhiên ... toán hợp xử lý ngôn ngữ Đây công cụ để biểu diễn tính toán ngữ nghĩa Chương hai trình bày lý thuyết biểu diễn diễn ngôn Phần đầu chương giới thiệu cách xây dựng cấu trúc biểu diễn diễn ngôn phương... nghĩa Khi biểu diễn câu biểu thức logic vị từ, tính toán lambda giúp định vị biến Khi xây dựng chương trình ứng dụng lý thuyết biểu diễn diễn ngôn, tính toán lambda thiếu biểu thức biểu diễn ngữ... câu (2) 20 CHƯƠNG LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN Với công cụ toán học nêu chương trước, ta biểu diễn câu văn qua công thức logic Trong chương ta xây dựng biểu diễn cho diễn ngôn gồm nhiều câu

Ngày đăng: 05/04/2016, 22:43

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN

  • GIỚI THIỆU

  • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

    • 1.1. LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT

      • 1.1.1 Các khái niệm cơ bản

      • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

        • 1.1. LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT

          • 1.1.2 Các khái niệm ngữ nghĩa

          • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

            • 1.1. LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT

              • 1.1.3 Phép hợp nhất (Unification)

              • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

                • 1.2. TÍNH TOÁN LAMBDA

                • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

                  • 1.2. TÍNH TOÁN LAMBDA

                    • 1.2.1 Cú pháp của tính toán lambda

                    • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

                      • 1.2. TÍNH TOÁN LAMBDA

                        • 1.2.2 Biến tự do và biến ràng buộc

                        • CHƯƠNG 1 CƠ SỞ TOÁN HỌC

                          • 1.2. TÍNH TOÁN LAMBDA

                            • 1.2.3 Các phép biến đổi

                            • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                              • 2.1. CÁC THÀNH PHẦN CƠ BẢN CỦA DRT

                                • 2.1.1 Tổng quan về DRT

                                • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                  • 2.1. CÁC THÀNH PHẦN CƠ BẢN CỦA DRT

                                    • 2.1.2 Cách xây dựng cấu trúc biểu diễn diễn ngôn

                                    • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                      • 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

                                        • 2.2.1 Ngôn ngữ DRS mở rộng bậc một

                                        • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                          • 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

                                            • 2.2.2 Ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin và khả năng thay đổi ngữ cảnh

                                            • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                              • 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

                                                • 2.2.3 Các lượng từ

                                                • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                                  • 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

                                                    • 2.2.4 Số nhiều

                                                    • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                                      • 2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

                                                        • 2.2.5 Thời và thể

                                                        • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                                          • 2.3 TIỀN GIẢ ĐỊNH (PRESUPPOSITION)

                                                            • 2.3.1 Ý nghĩa của tiền giả định

                                                            • CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

                                                              • 2.3 TIỀN GIẢ ĐỊNH (PRESUPPOSITION)

                                                                • 2.3.2 Một ví dụ

                                                                • CHƯƠNG 3 BIỂU DIỄN DIỄN NGÔN VỚI THAM CHIẾU THỜI GIAN TRONG TIẾNG VIỆT

                                                                  • 3.1 ĐỊNH VỊ THỜI GIAN

                                                                    • 3.1.1 Biểu diễn thời gian trong mối quan hệ với không gian

                                                                    • CHƯƠNG 3 BIỂU DIỄN DIỄN NGÔN VỚI THAM CHIẾU THỜI GIAN TRONG TIẾNG VIỆT

                                                                      • 3.1 ĐỊNH VỊ THỜI GIAN

                                                                        • 3.1.2 Định vị thời gian

Tài liệu cùng người dùng

Tài liệu liên quan