4 POS

20 12 0
  • Loading ...
1/20 trang

Thông tin tài liệu

Ngày đăng: 31/12/2018, 14:51

Định nghĩa Gán nhãn từ loại z Gán nhãn từ loại (Part of Speech tagging - POS gg g) từ g câu ợ gán g nhãn thẻ từ loại tagging): tương ứng z Lê Thanh Hương Bộ môn Hệ thống Thông tin Viện CNTT &TT – Trường ĐHBKHN Email: huonglt@soict.hust.edu.vn z Vào : đoạn văn tách từ + tập nhãn Ra: cách gán nhãn xác Ví dụ Ví dụ ụ2 Ví dụ Ví dụ Ví dụ ¾ Gán nhãn làm cho việc phân tích văn dễ dàng Tại cần gán nhãn? z z z Dễ thực hiện: thực nhiều phương pháp khác z Các phương pháp sử dụng ngữ cảnh đem lại kết tốt z Mặc dù nên thực phân tích văn Các ứng dụng: z Text-to-speech: record - N: [‘reko:d], V: [ri’ko:d]; lead – N [led], V: [li:d] z Tiền xử lý cho PTCP PTCP thực việc gán nhãn tốt đắt z Nhận dạng tiếng nói, PTCP, tìm kiếm, v.v… Dễ đánh giá (có thẻ gán nhãn đúng?) Tập từ loại tiếng Anh z Lớp đóng (các từ chức năng): số lượng cố định z z z z z z z Giới từ (Prepositions): on, under, over,… Tiểu từ (Particles): abroad, about, around, before, in, instead, since, without,… Mạo từ (Articles): a, an, the Liên từ (Conjunctions): and, or, but, that,… Đại từ ((Pronouns): ) yyou, me, I, your, y what, who,… Trợ động từ (Auxiliary verbs): can, will, may, should,… Lớp mở: có thêm từ Lớp từ mở tiếng Anh Tập nhãn cho tiếng Anh Proper nouns: IBM, Colorado nouns count nouns: book, ticket common nouns verbs auxiliaries mass nouns: snow, snow salt z Color: red, white open class adjectives tập ngữ liệu Brown: 87 nhãn tập thường sử dụng: z ¾ Age: old, young ¾ Value: good, bad ¾ Nhỏ: 45 nhãn - Penn treebank (slide sau) Trung bình: 61 nhãn, British national corpus Lớn: 146 nhãn, C7 Locatives adverbs: home, here, downhill adverbs Degree adverbs: extremely, very, somewhat Manner adverbs: slowly, delicately Temporal adverbs: yesterday, Monday I know that blocks the sun He always books the violin concert tickets early He says that book is interesting Khó khăn gán nhãn từ loại? Penn Treebank – ví dụ z The grand jury commented on a number of other topics … xử lý nhập nhằng Ö The/DT grand/JJ jury/NN commented/VBD on/IN a/DT number/NN of/IN other/JJ topics/NNS / Các phương pháp gán nhãn từ loại z z 10 Các cách tiếp cận Dựa xác suất: dựa xác suất lớn nhất, ấ dựa mơ hình Markov ẩ ẩn (hidden markov model – HMM) Pr (Det-N) > Pr (Det-Det) z Sử dụng HMM : “Sử dụng tất thơng tin có đốn” z Dựa ràng buộc ngữ pháp: “khơng đốn, loại trừ khả sai” Dựa luật If Then … z Dựa chuyển đổi: “Đốn Đốn trước, trước sau thay đổi” 11 12 Ví dụ -HMMs Gán nhãn dựa xác suất Cho câu ặ xâu từ,, gán g nhãn từ loại thường xảy cho từ xâu Cách thực hiện: z Hidden Markov model (HMM): Chọn thẻ từ loại làm tối đa xác suất: P(từ|từ lloại)•P(từ i) P(từ loại| l i| n từ lloạii phía hí trước) t ) The/DT grand/JJ jury/NN commented/VBD on/IN a/DT number/NN of/IN other/JJ topics/NNS / ⇒ P(jury|NN) = 1/2 Thực học có giám sát, sau suy diễn để xác định thẻ từ loại 13 Gán nhãn HMM Ví dụ z Cơng thức Bigram HMM: chọn ti cho wi có nhiều khả biết ti-1 i wi : ti = argmaxj P(tj | ti-1 , wi) (1) z Giả thiết đơn giản hóa HMM: vấn đề gán nhãn giải cách dựa từ thẻ từ loại bên cạnh ti = argmaxj P(tj | ti-1 )P(wi | tj ) 14 z (2) z xs chuỗi thẻ xs từ thường xuất với thẻ tj (các thẻ đồng xuất hiện) 15 Secretariat/NNP is/VBZ expected/VBN to/TO race/VB tomorrow/NN People/NNS continue/VBP to/TO inquire/VB the/DT reason/NN for/IN the/DT race/NN for/IN outer/JJ space/NN Không thể đánh giá cách đếm từ tập ngữ liệu ((và chuẩn hóa)) Muốn động từ theo sau TO nhiều danh từ (to race, to walk) Nhưng danh từ theo sau TO (run to school) 16 Giả sử có tất từ loại trừ từ race z z z Tính xác suất Xét P(VB|TO) P(NN|TO) z Chỉ nhìn vào từ đứng trước(bigram): to/TO race/??? NN or VB? the/DT race/??? Từ tập ngữ liệu Brown P(NN|TO)= 021 P(VB|TO)= 340 P(race|NN)= 0.00041 P(race|VB)= 0.00003 Áp dụng (2): ti = argmaxj P(tj | ti-1 )P(wi | tj ) Chọn thẻ có xác ác ssuất ất lớn xác ác ssuất: ất P(VB|TO)P(race|VB) P(NN|TO)P(race|NN) z z P(VB|TO)P(race|VB) P(VB|TO)P( |VB) = 0.00001 00001 P(NN|TO)P (race|NN) = 0.000007 ¾ race cần phải động từ sau “TO” xác suất từ race biết từ loại VB 17 18 I/PP know/VBP that/WDT block/NN blocks/NNS?VBZ? the/DT sun/NN Bài tập Mơ hình đầy đủ z I know that blocks the sun He always books the violin concert tickets early He says that book is interesting z I/PP know/VBP that/WDT blocks/VBZ the/DT sun/NN Chúng ta cần tìm chuỗi thẻ tốt cho toàn xâu Cho xâu từ W,, cần tính chuỗi từ loại có xác suất lớn T=t1, t2 ,…, tn hoặc, z He/PP always/RB books/VBZ the/DT violin/NN concert/NN tickets/NNS early/RB Tˆ = arg max P(T | W ) z z He/PP H /PP says/VBZ /VBZ that/WDT th t/WDT book/NN b k/NN is/VBZ i /VBZ interesting/JJ z I know that block blocks the sun z I/PP know/VBP that/DT block/NN blocks/NNS?VBZ? the/DT sun/NN 19 I/PP know/VBP that/WDT block/NN blocks/VBZ the/DT sun/NN z z ti = argmaxj P(tj | ti-1 )P(wi | tj ) z z T ∈τ ((nguyên g y lý ý Bayes) y ) 20 Mở rộng sử dụng luật chuỗi Giả thiết trigram P(A B) = P(A|B)P(B) = P(B|A)P(A) P(A,B) z P(A,B,C) = P(B,C|A)P(A) = P(C|A,B)P(B|A)P(A) = P(A)P(B|A)P(C|A,B) P ( wi | w1t ti −1ti ) = P ( wi | ti ) P(A,B,C,D…) = P(A)P(B|A)P(C|A,B)P(D|A,B,C ) z n P (T ) P (W | T ) = ∏ P ( wi | w1t1 wi −1ti −1ti ) P(ti |w1t1 wi −1ti −1 ) i =1 lịch sử nhãn pr từ Xác suất từ phụ thuộc vào nhãn Ta lấy lịch sử nhãn thông qua nhãn gần hất (trigram: (t i nhãn hã gần ầ hất + nhãn hã hiệ tại) P (ti | w1t ti −1 ) = P (ti | ti −2ti −1 ) 21 Thay vào công thức 22 Đánh giá xác suất z P(T)P(W|T) = n n i =3 i =1 Sử dụng quan hệ xác suất từ tập ngữ liệu để đá h giá đánh iá xác suất: ấ P (ti | ti −1ti −2 ) = P (t1 ) P(t2 | t1 )∏ P (ti | ti −2ti −1 )[∏ P( wi | ti )] P( wi | ti ) = 23 c(ti −2ti −1ti ) c(ti −2ti −1 ) c( wi , ti ) c(ti ) 24 Ví dụ Bài tốn NNS NNS NNS Cần giải DT Tˆ = arg max P(T ) P(W | T ) T ∈τ the Bây ta tính tất tích P(T)P(W|T) VB dog VBP saw ice-cream ice cream Tìm đường tốt nhất? 25 n n i =3 i =1 Cách tìm đường có điểm cao điểm cao PTìm (t1 ) P(đường t2 | t1 )∏ P (tcó i | ti − 2ti −1 )[∏ P ( wi | ti )] NNS 30 60 1 the Sử dụng tìm kiếm kiểu best-first (A*) z Tại ỗ bước, chọn k giá trị tốt ố ấ ( ) Mỗi ỗ giá trị k giá trị ứng với khả kết hợp nhãn tất từ Khi gán từ tiếp theo, tính lại xác suất Quay lại bước 30 NNS 75 DT 26 NNS 52 VB VBP dog saw ice-cream 27 z Ưu: nhanh ((không g cần kiểm tra tất khả g kết hợp, k tiềm nhất) z Nhược: khơng trả kết tốt mà chấp nhận 28 Cách tiếp cận thứ 2: gán nhãn dựa chuyển đổi Độ xác z z > 96% Cách đơn giản nhất? 90% z z z Transformation-based Learning (TBL): Gán từ với từ loại thường xuyên Gán từ chưa biết = danh từ Người: g 97%+/- 3%;; có thảo luận: ậ 100% z Kết hợp cách tiếp cận dựa luật cách tiếp cận xác suất: sử dụng học máy để chỉnh lại thẻ thông qua vài lần duyệt z Gá nhãn Gán hã sử ửd dụng tập tậ lluật ật tổng tổ quát át nhất, hất sau đến tập luật hẹp hơn, thay đổi số nhãn, tiếp tục 29 Transformation-based painting 30 Transformation-based painting 31 32 Transformation-based painting Transformation-based painting 33 Transformation-based painting 34 Transformation-based painting 35 36 Transformation-based painting Ví dụ với TBL 37 Luật gán nhãn từ loại Ví dụ với TBL 38 Gán từ với nhãn thường xuất (thường độ xác khoảng 90% ) Từ tập ngữ liệu Brown: P(NN|race)= 0.98 P(VB|race)= 0.02 …expected/VBZ to/ TO TO race/VB race/NN tomorrow/NN …the/DT th /DT race/NN /NN for/IN f /IN outer/JJ t /JJ space/NN /NN Sử dụng luật chuyển đổi: Thay NN VB thẻ trước TO pos: ‘NN’>’VB’ ← pos: ‘TO’ @[-1] o 39 40 Luật gán nhãn từ loại Học luật TB hệ thống TBL 41 Khuôn dạng cho luật gán nhãn từ loại Các tập ngữ liệu z Tập huấn luyện w0 w1 w2 w3 w4 w5 w6 w7 w8 w9 w10 z Tập ngữ liệu (CC 1) dt vb nn dt vb kn dt vb ab dt vb z Tập ngữ liệu tham khảo dt nn vb dt nn kn dt jj kn dt nn 42 z z z 43 Trong TBL, luật thỏa khuôn dạng học Ví dụ: luật tag:'VB'>'NN' ← tag:'DT'@[-1] tag:’NN’>’VB' ← tag:'DT'@[-1] thỏa khn dạng tag:A>B ← tag:C@[-1] Có thể tạo khn dạng sử dụng biến vô danh tag:_>_ ← tag:_@[-1] 44 Học luật TB hệ thống TBL Điểm, độ xác, ngưỡng z Điểm luật: score(R) = |pos(R)| - |neg(R)| z Độ xác: z Threshold: ngưỡng mà độ xác luật cần vượt qua để lựa chọn Trong TBL, ngưỡng độ xác thường < 0.5 z 45 Sinh tính điểm cho luật ứng viên z z z z z 46 Sinh tính điểm cho luật ứng viên Template = tag:_>_ ← tag:_@[-1] R1 = ttag:vb>nn b> ← tag:dt@[-1] t dt@[ 1] z z pos(R1) = neg(R1) = score(R1) = pos(R1) - neg(R1) = 3-1 = z z z 47 Template = tag:_>_ ← tag:_@[-1] R2 = ttag:nn>vb > b ← tag:vb@[-1] t b@[ 1] pos(R2) = neg(R2) = score(R2) = pos(R2) - neg(R2) = 1-0 = 48 Học luật TB hệ thống TBL Chọn luật tốt z Thứ hạng luật ứng viên R1 = tag:vb>nn ← tag:dt@[-1] Score = R2 = tag:nn>vb ← tag:vb@[-1] Score = … z z Nếu score threshold =< chọn R1 ngược g ợ lại score threshold > 2,, dừng g 49 Tối ưu hóa việc chọn luật tốt z 50 Tìm kiếm tham lam kiểu BestFirst Hàm giá Giảm dư thừa luật:chỉ sinh luật ứng viên phù hợp với liệu tập luyện z h(n) = giá ước lượng đường rẻ từ trạng thái nút n đến trạng thái đích Đánh giá tăng cường: z z Lưu vết luật ứng viên tốt Bỏ qua luật phù hợp với số lượng mẫu < score ủ luật tốt ố ấ 51 52 Phân tích lỗi: khó khăn gán nhãn từ loại Ưu điểm TBL z Luật tạo thủ cơng z Luật dễ hiểu logic z Dễ cài đặt z Có thể chạy nhanh (nhưng cài đặt phức tạp) Cá lỗi thô Các thông th thường (> 4%) z NN (common noun) vs NNP (proper noun) vs JJ (adjective): khó phân biệt, phân biệt quan trọng đặc biệt trích rút thơng tin z RP(particle) vs RB(adverb) vs IN(preposition):tất loại xuất sau động từ z VBD vs VBN vs JJ: phân biệt thời khứ, phân từ 2, tính từ (raced vs was raced vs the out raced horse) 53 Cách tốt phát từ chưa biết z z Gán nhãn từ loại tiếng Việt Câu tiếng Qua lần từ Sài_Gòn Quảng_Ngãi kiểm_tra Việt tách cơng_việc , Sophie Jane thường trò_chuyện với từ Mai , cảm cảm_nhận nhận ngọn_lửa_sống lửa sống niềm niềm_tin tin mãnh_liệt từ người phụ_nữ VN Dựa dạng đuôi biến tố ((-ed, ed -s, s -ing); ing); 32 đuôi phái sinh (-ion, etc.); chữ hoa; gạch nối Câu tiếng Việt gán nhãn từ loại Tổng quát hơn: z z 54 Phân tích hình thái từ Các cách tiếp cận học máy Qua lần từ Sài_Gòn Quảng_Ngãi kiểm_tra cơng_việc , Sophie Jane thường trò_chuyện với Mai , cảm_nhận ngọn_lửa_sống niềm_tin mãnh_liệt từ người phụ_nữ VN Chú thí thích h từ loại 55 56 Các bước thực z Tách từ z z z Dữ liệu phục vụ gán nhãn Gán nhãn Gá hã tiên tiê nghiệm hiệ ((gán ỗi từ với ới tất ả nhãn hã từ lloạii mà có) Với từ mới, dùng nhãn ngầm định gắn cho tập tất nhãn Với ngơn ngữ biến đổi hình thái Ỉ dựa vào hình thái từ z z z z ¾ z z dựa vào quy y tắc ngữ g pháp dựa vào xác suất sử dụng mạng nơ-ron hệ thống lai sử dụng kết hợp tính tốn xác suất ràng buộc ngữ pháp gán nhãn nhiều tầng z Từ điển từ vựng Kho văn gán nhãn, kèm theo quy tắc ngữ pháp xây dựng tay Kho văn chưa gán nhãn, có kèm theo thông tin ngôn ngữ tập từ loại Kho văn chưa gán nhãn nhãn, với tập từ loại xây dựng tự động nhờ tính tốn thống kê 57 Khó khăn gán nhãn từ loại tiếng Việt z Ngữ liệu: z Quyết định kết gán nhãn (loại bỏ nhập nhằng) z z z 58 Cách tiếp cận đặc trưng riêng ngôn ngữ thiếu kho liệu chuẩn Brown hay Penn Treebank khó khăn đánh giá kết [Đinh Điền] Dien Dinh and Kiem Hoang, POS-tagger for EnglishVietnamese bilingual corpus corpus HLTNAACL Workshop on Building and using parallel texts: data driven machine translation and beyond, 2003 z chuyển đổi ánh xạ từ thông tin từ loại từ tiếng Anh z z 59 gán nhãn từ loại tiếng Anh đạt độ xác cao ( >97%) thành cơng gần phương pháp gióng hàng từ (word alignment methods) cặp ngôn ngữ 60 [Đinh Điền] [Đinh Điền] z Xây dựng tập ngữ liệu song ngữ Anh – Việt ~ triệu từ (cả Anh lẫn Việt) Việt) z gán nhãn từ loại cho tiếng Anh dựa Transformationbased Learning – TBL [Brill 1995] z gióng hàng hai ngơn ngữ (độ xác khoảng 87%) để chuyển nhãn từ loại sang tiếng Việt z kết hiệu chỉnh tay để làm liệu huấn luyện cho gán nhãn từ loại tiếng Việt z z Ưu điểm: z tránh t h đ việc iệ gán nhãn hã từ loại l i bằ tay t nhờ hờ tận tậ dụng thông tin từ loại ngôn ngữ khác Nhược: z Tiếng Anh tiếng Việt khác nhau: cấu tạo từ, trật tự chức ngữ pháp từ câu Ỉ khó khăn gióng hàng z Lỗi tích lũy qua hai giai đoạn: (a) gán nhãn từ loại cho tiếng Anh (b) gióng hàng hai ngơn ngữ z Tập nhãn chuyển đổi trực tiếp từ tiếng Anh sang tiếng Việt khơng điển hình cho từ loại tiếng Việt 61 [Nguyen Huyen, Vu Luong] Cách tiếp cận z [Nguyen Huyen, Vu Luong] Thi Minh Huyen Nguyen, Laurent Romary, and Xuan Luong Vu, Romary Vu A Case Study in POS Tagging of Vietnamese Texts The 10th annual conference TALN 2003 z dựa tảng tính chất ngơn ngữ tiếng Việt xây dựng tập từ loại (tagset) cho tiếng Việt dựa chuẩn mô tả tổng quát ngơn ngữ Tây Âu, nhằm mơ đun hóa tập nhãn hai mức: z z z 62 mức bản/cốt lõi (kernel layer): đặc tả chung cho ngơn ngữ mức tính chất riêng (private layer): mở rộng chi tiết hóa cho ngơn ngữ cụ thể dựa tính chất ngơn ngữ 63 z mức bản: danh từ (noun – N), động từ (verb – V), tính từ (adjective – A), A) đại từ (pronoun – P), P) mạo từ (determine – D), trạng từ (adverb – R), tiền-hậu giới từ (adposition – S), liên từ (conjunction – C), số từ (numeral – M), tình thái từ (interjection – I), từ ngoại Việt (residual – X, foreign words, ) z mức tính chất riêng: triển khai tùy theo dạng từ lloạii ttrên ê h d danh h từ đế đếm đ được/không /khô đế đếm đ danh từ, giống đực/cái đại từ, v.v 64 Thủ tục gán nhãn từ loại [Phương] Cách tiếp cận z z z [Phuong] Nguyễn Thị Minh Huyền, Vũ Xuân Lương, Lê Hồng Phương Sử dụng gán nhãn từ loại xác suất QTAG cho văn tiếng Việt Kỷ yếu Hội thảo ICT.rda’03 làm việc cửa sổ chứa từ, sau bổ sung thêm từ giả đầu cuối văn bản Nhãn gán cho từ lọt cửa sổ nhãn kết cuối 65 [Phương] z z z z Đọc từ (token) Tì Tìm từ ttrong từ điển điể Nếu khơng tìm thấy, gán cho từ tất nhãn Với nhãn a tính Pw = P(tag|token) b tính Pc = P(tag|t1,t2), t1, t2, nhãn tương ứng hai từ đứng trước từ token c tính Pw,c = Pw * Pc, kết ế hợp hai xác suất ấ Lặp lại phép tính cho hai nhãn khác cửa sổ Sau lần tính lại (3 lần cho từ), xác suất kết kết hợp xác suất toàn thể nhãn gán cho từ 66 [Phương] Chia kho văn gán nhãn làm tập: tập huấn luyện tập thử nghiệm Tự động gán nhãn cho phần văn So sánh kết thu với liệu mẫu Thời gian huấn luyện với 32000 từ: ~ 30s z Câu gán nhãn: pos= Nc > hồi pos= Vto > lên < w pos="Nn"> pos= Nn > sáu , có lần nhìn thấy tranh tuyệt đẹp Nc - danh từ đơn thể thể, Vto - ngoại động từ hướng hướng, Nn - danh từ số lượng, Vs - động từ tồn tại, Nu - danh từ đơn vị, Pp - đại từ nhân xưng, Jt - phụ từ thời gian, Vt - ngoại động từ, Nt - danh từ loại thể, Jd - phụ từ mức độ, Aa - tính từ hàm chất 67 68 z z Precision = số từ gán nhãn đúng/ tổng số từ gán nhãn Recall = số từ gán nhãn đúng/ tổng số từ [Phương] Câu từ tập ngữ liệu mẫu pos= Nc > hồi pos= Vto > lên < w pos="Nn"> pos= Nn > sáu , có lần nhìn thấy tranh tuyệt đẹp Câu chương trình gán nhãn pos= Nc > hồi nhìn thấy tranh tuyệt đẹp z 69 z Phan Xuân Hiếu: ~94% (9 nhãn từ vựng 10 nhãn cho loại kí hiệu) ~85% (48 nhãn từ vựng 10 nhãn cho loại kí hiệu) z dựa phương pháp Maximum Entropy (MaxEnt) Conditional Random Fields (CRFs) - ứng dụng nhiều cho toán gán nhãn cho thành phần liệu chuỗi Nếu không dùng đến từ điển từ vựng (chỉ sử dụng kho văn gán nhãn mẫu) ẫ kết đạt tương ứng ~80% ~60% z Dữ liệu huấn luyện: tập ngữ liệu Viet Treebank bao gồm 10 10.000 000 câu tiếng Việt gán nhãn từ loại chuyên gia ngôn ngữ Kết quả: z z z (R Ở)(N số)(M 10)(N phố)(Np Hàng Mành)(Np Hà Nội)(, ,) (N vợ chồng) (Np Dương Tuấn) (( -)) (Np Ðặng Hải Lý)(, ,) (M 26) (N tuổi)(, ,)(V mở)(N lớp) (V dạy)(V viết)(N chữ) (A đẹp)( .) (N Lớp học)(C của)(P họ)(R ngày càng)(A thu hút) (A nhiều)(N học viên)( .) 70 Cách tiếp cận [Phương] z (E Ở)(N số)(M 10)(N phố)(Np Hàng Mành)(Np Hà Nội)(, ,) (N vợ chồng) (Np Dương Tuấn) (- -) (Np Ðặng Hải Lý)(, ,) (M 26) (N tuổi)(, ,)(V mở)(N lớp) (V dạy)(V viết)(N chữ) (A đẹp)( .) (N Lớp học)(E của)(P họ)(X ngày càng)(V thu hút) (L nhiều)(N học viên)( .) 71 72 [Hiếu] Trích chọn đặc trưng z z thường trò_chuyện với Mai Cầ xác Cần đị định h từ lloạii cho h từ “t “trò_chuyện”, ò h ệ ” đặ đặc ttrưng: z z z z z Học mô hình gán nhãn từ loại Chính thân từ “trò_chuyện” thường xuất với từ loại tập liệu Viet Treebank? Từ “trò_chuyện” thường có nhãn từ loại từ điển? Là động từ chăng? Từ “thường” trước từ “trò_chuyện” thường có gợi ý gì? Từ “với” với sau từ “trò trò_chuyện chuyện” có gợi ý gì? Có phải gợi ý trước động từ hay khơng? Kết hợp hai từ “với Mai” gợi ý điều gì, từ trước (“trò_chuyện”) nên động từ? 73 Ngữ cảnh cho trích xuất đặc trưng 74 Ngữ cảnh cho trích xuất đặc trưng 75 76 Kết gán nhãn sử dụng MaxEnt CRFs Tập từ loại tiếng Việt idPOS 10 11 12 13 77 Tập tiểu từ loại tiếng Việt idPOS idSub symbol vnPOS POS POS 1 Np danh từ riêng Nc danh từ đơn thể Ng danh từ tổng thể Na danh từ trừu tượng Ns danh từ loại Nu danh từ đơn vị Nq danh từ lượng Vi động từ nội động Vt động từ ngoại động 10 Vs động từ trạng thái 11 Vm động từ tình thái 12 Vr động từ quan hệ 13 Ap tính từ tính chất 14 Ar tính từ quan hệ 15 Ao tính từ tượng 16 Ai tính từ tượng hình vnPOS danh từ động từ tính từ số từ đại từ phụ từ giới từ liên từ trợ từ cảm từ từ tắt yếu tố từ (bất, vô…) không xác định enPOS noun verb adjective numeral pronoun adverb preposition conjunction auxiliary word emotivity word abbreviation component stem undetermined •Từ tắt mang nhãn kép: X = từ loại từ tắt ; •y = kí hiệu từ tắt Ví dụ: GDP-Ny ; HIV – Ny 78 Tập tiểu từ loại tiếng Việt enPOS proper noun countable noun collective Noun abstract noun classifier noun unit noun quantity noun intransitive verb transitive verb state verb modal verb relative verb property adjective relative adjective onomatopoetic adjective pictographic adjective symbolPOS N V A M P R O C I E Xy* S U idPOS idSub symbol vnPOS POS POS 17 Mc số từ số lượng 18 Mo số từ thứ tự 19 Pp đại từ xưng hô 20 Pd đại từ định 21 Pq đại từ số lượng 22 Pi đại từ nghi vấn 23 R phụ từ 24 O giới từ 25 C liên từ 26 I trợ từ 10 27 E cảm từ 11 28 Xy từ tắt 12 29 S yếu tố từ (bất, vô…) 13 30 U không xác định 79 enPOS cardinal numeral ordinal numeral personal pronoun demonstrative pronoun quality pronoun interrogative pronoun adverb preposition conjunction auxiliary word emotivity word abbreviation component stem undetermined 80
- Xem thêm -

Xem thêm: 4 POS , 4 POS

Từ khóa liên quan

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay