ĐỀ CƯƠNG MÔN HỌC MÔN: NHẬP MÔN NGÔN NGỮ HỌC TÍNH TOÁN (Computer Linguistics)

17 684 2
ĐỀ CƯƠNG MÔN HỌC  MÔN: NHẬP MÔN NGÔN NGỮ HỌC TÍNH TOÁN (Computer Linguistics)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Sinh viên được trang bị các kiến thức cơ bản để có thể trở thành người chú giải ngôn ngữ (linguistic annotators), biên tập viên nội dung số, nhà nghiên cứu về ngôn ngữ học kho ngữ liệu (corpus linguistics), và nhà nghiên cứu về ngôn ngữ học tính toán (computational linguistics), v.v.

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN KHOA NGÔN NGỮ HỌC ________________________________ ĐỀ CƯƠNG MÔN HỌC MÔN: NHẬP MÔN NGÔN NGỮ HỌC TÍNH TOÁN (Computer Linguistics) Chương trình đào tạo : Cử nhân Ngôn ngữ học. Đào tạo theo nhiệm vụ chiến lược của ĐHQG Hà Nội Người biên soạn: TS Nguyễn Phương Thái HÀ NỘI - 2012 1 ĐỀ CƯƠNG MÔN HỌC MÔN: HẬP MÔN NGÔN NGỮ HỌC TÍNH TOÁN 1. Thông tin về giảng viên: Giảng viên 1: - Họ và tên: Nguyễn Phương Thái - Chức danh, học vị: Giảng viên, Tiến sĩ - Thời gian làm việc: Thứ…… (8:00 -16:00) - Địa điểm làm vịêc: Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, ĐHQG Hà Nội (P306, Nhà E3, 144 Xuân Thủy, Cầu Giấy, Hà Nội) - Điện thoại: 0902059945 - Email: thainp@vnu.edu.vn Các hướng nghiên cứu chính: + Các vấn đề về giao tiếp ngôn ngữ + Các vấn đề về ngôn ngữ máy tính + Dịch máy và các vấn đề liên quan Giảng viên 2: - Họ và tên: Lê Anh Cường - Chức danh, học vị: Giảng viên, Tiến sĩ - Thời gian làm việc: Thứ…… (8:00 -16:00) - Địa điểm làm vịêc: Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, ĐHQG Hà Nội (P306, Nhà E3, 144 Xuân Thủy, Cầu Giấy, Hà Nội) - Điện thoại: 0902134662 - Email: cuongla@vnu.edu.vn Các hướng nghiên cứu chính: + Các vấn đề về ngôn ngữ tự nhiên và ngôn ngữ nhân tạo + Các vấn đề về ngôn ngữ lập trình máy tính 2 + Dịch máy và các vấn đề liên quan Giảng viên 3: - Họ và tên: Phạm Bảo Sơn - Chức danh, học vị: Giảng viên, Tiến sĩ - Thời gian làm việc: Thứ…… (8:00 -16:00) - Địa điểm làm vịêc: Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, ĐHQG Hà Nội (P306, Nhà E3, 144 Xuân Thủy, Cầu Giấy, Hà Nội) - Điện thoại: 0936413663 - Email: sonpb@vnu.edu.vn 2. Thông tin về môn học - Tên môn học: Ngôn ngữ học Máy tính - Mã môn học: LIN 3057 - Số tín chỉ: 02 - Loại môn học: Tự chọn - Môn học tiên quyết: Dẫn luận Ngôn ngữ học Ứng dụng - Số giờ tín chỉ: 30 trong đó: + Lí thuyết: 30 + Thực hành: 0 + Tự học: 0 3. Mục tiêu và chuẩn đầu ra môn học 3.1. Mục tiêu chung Sinh viên được trang bị các kiến thức cơ bản để có thể trở thành người chú giải ngôn ngữ (linguistic annotators), biên tập viên nội dung số, nhà nghiên cứu về ngôn ngữ học kho ngữ liệu (corpus linguistics), và nhà nghiên cứu về ngôn ngữ học tính toán (computational linguistics), v.v. 3.2. Chuẩn đầu ra môn học 3.2.1. Chuẩn đầu ra về kiến thức 3 - Hiểu được đối tượng, mục đích, nhiệm vụ, phương pháp nghiên cứu của ngôn ngữ học máy tính (NNHMT), ứng dụng của NNHMT, và một số hướng nghiên cứu chính trong NNHMT. - Hiểu được văn phạm phi ngữ cảnh, ứng dụng văn phạm này trong biểu diễn cú pháp ngôn ngữ tự nhiên. - Hiểu cấu trúc của WordNet, ứng dụng của WordNet. - Hiểu quá trình chú giải ngữ liệu, ngôn ngữ đánh dấu dùng biểu diễn dữ liệu. - Nắm được một số tiến bộ trong xử lý ngôn ngữ nói chung và xử lý tiếng Việt nói riêng. 3.2.2. Chuẩn đầu ra về kỹ năng - Biết cách xây dựng văn phạm phi ngữ cảnh với các yêu cầu cho trước (liên quan đến dạng câu, hiện tượng ngôn ngữ, v.v.). - Có thể tham gia vào công việc chú giải ngôn ngữ học - sử dụng một số công cụ tin học hỗ trợ - sử dụng ngôn ngữ đánh dấu - tuân thủ các yêu cầu về qui trình chú giải, đánh giá, guideline - áp dụng kiến thức, lập luận ngôn ngữ học trong quá trình chú giải - Hiểu và sử dụng hiệu quả hơn các công cụ tin học như từ điển, tìm kiếm, dịch tự động, v.v. 3.2.3 Chuẩn đầu ra về thái độ - Sự khác biệt giữa xử lý ngôn ngữ bởi máy tính và bởi con người. - Vai trò của nhà ngôn ngữ học trong xây dựng một ứng dụng xử lý ngôn ngữ. - Hướng đến mục tiêu chung của hai ngành tin học và ngôn ngữ học: tự động hóa xử lý ngôn ngữ, máy tính hiểu được tiếng Việt. 4. Tóm tắt nội dung môn học Bài giảng 1 giới thiệu các thông tin cơ bản về môn học như thông lệ của một đề cương. Bài giảng 2 giới thiệu một số ứng dụng phổ biến, nguyên lý hoạt động, các vấn đề ngôn ngữ học mà các ứng dụng này phải giải quyết và 4 các hạn chế hiện tại. Bài giảng này có mục đích dẫn dắt người học bắt đầu từ thực tế, hướng đến các nội dung kế tiếp. Bài giảng 3 giới thiệu về chương trình máy tính, ngôn ngữ máy tính. Việc giới thiệu là tổng quan, không đi quá sâu vào kỹ thuật. Bài giảng 4 giới thiệu về ngôn ngữ hình thức và phân loại văn phạm của Chomsky. Ngôn ngữ hình thức là công cụ nền tảng để máy tính xử lý được các loại ngôn ngữ từ nhân tạo đến tự nhiên. Bài giảng 5 giới thiệu về các bài toán xử lý ngôn ngữ và tiếp cận giải quyết. Trọng tâm là tiếp cận dựa trên kho ngữ liệu. Bài giảng 6 giới thiệu về chú giải ngôn ngữ học, các vấn đề liên quan đến chú giải. Bài giảng 7 cung cấp nội dung thực hành hết sức quan trọng, thông qua đó sinh viên có thể áp dụng kiến thức đã học để chú giải ngôn ngữ, xử lý nhập nhằng, v.v. Bài giảng 8 là nội dung lựa chọn, cung cấp cho người học một số kiến thức về thống kê ngôn ngữ. Chú ý là mỗi bài giảng có thể trong một hoặc vài buổi học. 5. Nội dung môn học - Nội dung 1: Giới thiệu môn học o Mục tiêu môn học, các yêu cầu o Qui trình phát triển một ứng dụng xử lý ngôn ngữ, vai trò của nhà ngôn ngữ học o Nội dung môn học o Tài liệu tham khảo - Nội dung 2: Các công cụ tin học thông dụng liên quan đến xử lý ngôn ngữ và nguyên lý hoạt động o Công cụ tìm kiếm o Công cụ dịch tự động o Công cụ kiểm lỗi chính tả o V.v. - Nội dung 3: Chương trình máy tính, ngôn ngữ máy tính, và xử lý ngôn ngữ trên máy tính o Chương trình máy tính o Ngôn ngữ máy tính (ngôn ngữ nhân tạo) o Các mức độ xử lý ngôn ngữ tự nhiên trên máy tính: bảng mã, từ, câu, v.v. - Nội dung 4: Ngôn ngữ hình thức và phân loại văn phạm của Chomsky o Các khái niệm cơ bản của ngôn ngữ hình thức 5 o Sơ đồ phân loại văn phạm của Chomsky o Biểu diễn tri thức ngôn ngữ học bằng văn phạm hình thức (biểu thức chính qui, văn phạm phi ngữ cảnh, v.v.) - Nội dung 5: Các bài toán xử lý ngôn ngữ và các hướng tiếp cận chính o Các bài toán o Tiếp cận dựa trên luật o Tiếp cận thống kê (nhấn mạnh vai trò của kho ngữ liệu và chú giải ngôn ngữ) - Nội dung 6: Chú giải ngôn ngữ o Qui trình chú giải o Biểu diễn dữ liệu bằng XML o Đảm bảo chất lượng kho ngữ liệu o Các ví dụ - Nội dung 7: Thực hành chú giải ngôn ngữ cho các bài toán xử lý ngôn ngữ cơ bản. Demo công cụ xử lý ngôn ngữ. Chọn một hoặc một số trong danh sách sau đây để thực hành: o Bài toán tách từ o Bài toán gán nhãn từ loại o Bài toán phân tích cú pháp o Xử lý nhập nhằng nghĩa của từ o Các ứng dụng lớn: dịch tự động, tóm tắt văn bản, hỏi đáp - Nội dung 8 (lựa chọn): Phân tích thống kê kho ngữ liệu o Thống kê từ vựng o Thống kê ngữ cảnh sử dụng của từ o Thống kê mẫu cú pháp 6. Tài liệu phục vụ cho môn học 6.1 Tài liệu bắt buộc [1] Jurafsky, D. and Martin, J.H. (2nd edition). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall, Upper Saddle River, NJ. ISBN 0-13-095069-6 6.2 Tài liệu tham khảo thêm [2] Elenal Tognini-Bonelli. Corpus Linguistics at Work. John Benjamins Publishing Company. 2001. 6 [3] Corpus Linguistics Investigating Language Structure and Use. Douglas Biber, Susan Conrad, Randi Reppen. Cambridge University Press. 1998. [4] Manning, C.D. and Schütze, H. Foundations of Statistical Natural Language Processing. MIT Press. ISBN 0-262-13360-1 [5] http://jones.ling.indiana.edu/~mdickinson/09/615/ [6] http://nlp.stanford.edu/~manning/courses/compapp/ 7. Lịch trình giảng dạy môn học Tuần 1 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết 1. Mục tiêu môn học, các yêu cầu 2. Quy trình phát triển một ứng dụng xử lý ngôn ngữ, vai trò của nhà ngôn ngữ học - Nắm được tầm quan trọng, mục tiêu, các yêu cầu của môn học - Nắm vững quy trình phát triển một ứng dụng xử lý ngôn ngữ, vai trò của nhà ngôn ngữ học Đọc các phần tương ứng trong tài liệu 1; 2; 3 Thảo luận Vai trò nhà ngôn ngữ học Tuần 2 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết 1. Giới thiệu khái quát nội dung môn học 2. Vị trí của ngôn ngữ học tính toán trong ngôn ngữ học ứng - Nắm được các nội dung mà môn Ngôn ngữ học tính toán quan tâm Đọc các phần tương 7 dụng 3. Mối quan hệ giữa ngôn ngữ học tính toán với các phân môn ngôn ngữ học 2. Giới thiệu tài liệu tham khảo phục vụ môn học - Thấy được vị trí của ngôn ngữ học tính toán trong ngôn ngữ học ứng dụng nói riêng và các phân ngành khác của ngôn ngữ học nói chung ứng trong tài liệu 1;2;3 Thảo luận Thảo luận xung quanh các nội dung mà ngôn ngữ học tính toán hướng đến Bài tập Luyện kĩ năng . Tuần 3 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết Khái quát về các công cụ tin học thông dụng liên quan đến xử lý ngôn ngữ và nguyên lý hoạt động - Hiểu và làm quen được với các công cụ tin học thông dụng liên quan đến xử lý ngôn ngữ và nguyên lý hoạt động của chúng Đọc các phần tương ứng trong tài liệu 1;2;3;4 Thảo luận Thảo luận xung quanh nội dung bài học có hướng dẫn của GV Bài tập Thực hành về các công 8 Luyện kĩ năng cụ tin học Tuần 4 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết 1. Công cụ tìm kiếm 2. Công cụ dịch tự động - Sử dụng thành thạo thanh công cụ tìm kiếm - Sử dụng tốt thanh công cụ dịch tự động Đọc các phần tương ứng trong tài liệu 1;2;3;5 Bài tập Luyện kĩ năng Rèn luyện các kỹ năng sử dụng các thanh công cụ có trong bài học Thực hành theo hướng dẫn Tuần 5 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết 1. Công cụ kiểm chữa lỗi chính tả 2. Một số công cụ phụ trợ khác - Sử dụng thành thạo thanh công cụ chữa lỗi chính tả và một số công cụ phụ trợ khác Đọc các phần tương ứng trong tài liệu 1;2;3;4; 9 5 Bài tập Luyện kĩ năng Rèn luyện các kỹ năng sử dụng các thanh công cụ có trong bài học Thực hành theo hướng dẫn Tuần 6 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết Chương trình máy tính, ngôn ngữ máy tính, và xử lý ngôn ngữ trên máy tính: 1. Chương trình máy tính 2. Ngôn ngữ máy tính (ngôn ngữ nhân tạo) 3. Các mức độ xử lý ngôn ngữ tự nhiên trên máy tính: bảng mã, từ, câu… - Hiểu biết về chương trình máy tính - Bước đầu nắm bắt được cơ chế ngôn ngữ máy tính - Làm quen với các mức độ xử lý ngôn ngữ tự nhiên trên máy tính: bảng mã, từ, câu, v.v. Đọc các phần tương ứng trong tài liệu 1;2;3;4; 5 Bài tập Luyện kĩ năng Thực hiện một số thao tác xử lý ngôn ngữ trên máy tính theo hướng dẫn Tuần 7 HÌNH THỨC DẠY HỌC NỘI DUNG CHÍNH YÊU CẦU ĐỐI VỚI SINH VIÊN GHI CHÚ Lý thuyết 1. Giới thiệu về Ngôn ngữ - Có nhận thức căn bản Đọc 10 [...]... YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN - Thực hành chú giải ngôn - Hiểu và thực hiện tốt Đọc ngữ cho các bài toán xử lý bài toán tách từ và bài các ngôn ngữ cơ bản Demo công toán gán nhãn từ loại phần cụ xử lý ngôn ngữ Chọn một tương hoặc một số trong danh sách ứng sau đây để thực hành: 1 Thực hiện bài toán tách từ 2 Thực hiện bài toán gán trong tài liệu 1;2;3;4; nhãn từ loại... biểu diễn tri thức học ngôn ngữ học bằng văn phạm hình thức (biểu thức chính qui, văn phạm phi ngữ cảnh, v.v.) Tuần 10 HÌNH NỘI DUNG YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN 1 Giới thiệu về các bài toán - Nắm vững các hướng Đọc xử lý ngôn ngữ và các hướng tiếp cận chính các tiếp cận chính phần 2 Một số dạng bài toán cụ - Xử lý được một số tương thể dạng bài toán cụ thể ứng trong... sự cần thiết phải thực hiện các bài toán xử lý 14 ngôn ngữ Bài tập Luyện Thực hành bài toán kĩ tách từ và bài toán gán năng nhãn từ loại Tuần 14 HÌNH NỘI DUNG YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN 1 Bài toán phân tích cú - Hiểu và thực hiện tốt Đọc pháp 2 Xử lý bài toán phân tích cú các nhập nhằng pháp; Xử lý được vấn phần nghĩa của từ đề nhập nhằng nghĩa từ tương 3 Các ứng... các bài toán xử lý ngôn ngữ; các hướng 12 tiếp cận chính Bài tập Luyện - Thực hành một số kĩ dạng bài toán cụ thể năng Tuần 11 HÌNH NỘI DUNG YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN 1 Hướng tiếp cận dựa trên - Nắm vững được hai luật hướng tiếp cận chính 2 Hướng tiếp cận Tiếp cận trong xử lý ngôn ngữ thống kê (nhấn mạnh vai trò hình thức của kho ngữ liệu và chú giải ngôn ngữ) Đọc... thức và phân loại văn về ngôn ngữ hình thức phạm của Chomsky các - Nắm vững các khái phần 2 Các khái niệm cơ bản của niệm cơ bản của ngôn tương ngôn ngữ hình thức ngữ hình thức theo ứng quan niệm của trong Chomsky tài liệu 1;2;3;4; 5 Bài tập Luyện Rèn kỹ năng nhận biết các kĩ đặc điểm của ngôn ngữ hình năng thức theo cách nhận diện của Chomsky Tuần 8 HÌNH NỘI DUNG THỨC CHÍNH DẠY HỌC Lý thuyết YÊU CẦU... ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN 1 Sơ đồ phân loại văn phạm - Nắm được sơ đồ phân Đọc của Chomsky loại văn phạm của các 2 Biểu diễn tri thức ngôn Chomsky phần ngữ học bằng văn phạm hình - Nắm được cách biểu tương thức (biểu thức chính qui, văn diễn tri thức ngôn ngữ 11 phạm phi ngữ cảnh, v.v.) học bằng văn phạm ứng hình thức (biểu thức trong chính qui, văn phạm tài liệu phi ngữ cảnh, v.v.) 1;2;3;4;... tài liệu 1;2;3;4; 5 Thảo luận Vai trò của việc phân tích Đặt thống kê kho ngữ liệu câu hỏi xung quanh nội dung môn học để chuẩn bị kiểm tra cuối kỳ Bài tập Luyện Rèn luyện thao tác phân tích kĩ thống kê kho ngữ liệu năng Chính sách đối với môn học • Thực hiện đầy đủ nhiệm vụ của sinh viên được ghi trong môn học • Tham dự lớp học đầy đủ (không nghỉ quá 20 % số giờ) • Chuẩn bị bài trước khi đến lớp,... phần 8 Phương pháp kiểm tra, đánh giá kết quả học tập 8.1 Hình thức kiểm tra và trọng số TT 1 Hình thức kiểm tra Kiểm tra đánh giá 3 thường xuyên Kiểm tra định kì Thi hết môn Trọng số 10% tập 4 2 3 Nội dung kiểm tra Tham gia lớp học, thái độ học Kiểm tra bài cũ, bài tập về nhà Các nội dung thông báo trước Các nội dung chính của môn 16 30% 60% học Điểm môn học 100% 8.2 Tiêu chí đánh giá các loại bài tập,... thiệu trong bài học Bài tập Luyện Thực hành cách tiếp kĩ cận bài toán dựa trên năng luật và dựa vào thống kê Tuần 12 HÌNH NỘI DUNG YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC Lý thuyết VIÊN - Nắm vững quy trình Đọc Chú giải ngôn ngữ: 13 chú giải các 1 Qui trình chú giải - Biết biểu diễn dữ liệu phần 2 Biểu diễn dữ liệu bằng bằng XML tương XML ứng 3 Đảm bảo chất lượng kho trong ngữ liệu 4 Các ví... tắt văn bản, hỏi đáp Bài tập Luyện Kỹ năng giải quyết bài kĩ toán phân tích cú pháp năng và phân tích ngữ nghĩa Tuần 15 HÌNH NỘI DUNG YÊU CẦU GHI THỨC CHÍNH ĐỐI VỚI SINH CHÚ DẠY HỌC VIÊN 15 Lý thuyết Phân tích thống kê kho ngữ Biết cách phân tích Đọc liệu: thống kê từ vựng, bối các 1 Thống kê từ vựng cảnh sử dụng, mẫu cú phần 2 Thống kê ngữ cảnh sử pháp tương dụng của từ ứng 3 Thống kê mẫu cú pháp

Ngày đăng: 27/01/2015, 15:12

Mục lục

  • Người biên soạn:

  • TS Nguyễn Phương Thái

    • HÀ NỘI - 2012

    • Bài tập nhóm

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan