Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)

44 171 0
Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)Nghiên cứu xây dựng ứng dụng xử lý văn bản luật giao thông (Đồ án tốt nghiệp)

I H C QU C GIA HÀ N I I H C CÔNG NGH NGHIÊN C U XÂY D NG NG D NG X N LU T GIAO THÔNG KHÓA LU N T T NGHI I H C H CHÍNH QUY Ngành: Cơng ngh thơng tin 2015 I H C QU C GIA HÀ N I I H C CÔNG NGH NGHIÊN C U XÂY D NG NG D NG X N LU T GIAO THƠNG KHĨA LU N T T NGHI I H C H CHÍNH QUY Ngành: Công ngh thông tin Cán b ng d n: PGS TS Nguy n Vi t Hà - 2015 VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY Nguyen Ha Thanh RESEARCH AND PROPOSE VIETNAMESE TRAFIC LAW PROCESSING METHOD A THESIS PRESENTED FOR THE DEGREE BACHELOR Major: Information Technology Supervisor: Assoc Prof Nguyen Viet Ha HA NOI - 2015 TÓM T T Tóm t t: M c dù nhu c u pháp c a xã h i ngày m t cao, h th ng pháp lu t c a Vi t Nam v n nhi m ch ng chéo, liên t c ti p c n, áp d ng, s d ng th c thi pháp lu t Ngày v i s phát tri n nhanh chóng c a k thu t h c máy c bi t k thu t s d ng m ng nhân t o, nhi u ng d ng thơng i giúp ích r t nhi u cho cu c s i Trong gi i h n c a m t khóa lu n t t nghi p c a sinh viên tài nghiên c u gi i quy t xây d n câu lu t giao thơng có hình thái khác u hi ng ng ti p c gi i quy t v s d ng k thu o h c máy Cách th c ti n hành th c nghi m c tài phù h ch ng minh tính kh thi c c nh ng k t qu u ng, m tri n v ng cho ng d ng ch ng cao x v pháp T khóa: M , x ti ng vi t, lu t giao thông SUMARY Sumary: Nowadays, the demands for legal services in our society are rising sharply However, the legal system in Vietnam is still greatly overlapping and constantly changing, which creates considerable difficulties for people in accessing, applying and using the law for legitimate reasons Today, with the rapid development of machine learning, especially the technical uses of artificial neural network, many smart applications were born and became very helpful for human life Within the scope of a graduation paper for the bachelor degree, this research aims at studying related knowledge and building a program having the capacity to detect the traffic law sentences which are in different morphology but express similar meaning The main approach to achieve these aims is to use techniques in machine learning artificial neurons Experimental methods proposed in this research are suitable for proving the method Initial results are rather impressive, opening up prospects for high quality applications in handling legal issues Keyword: Artificial neural network, Vietnamese processing, traffic law L nh c trình bày m t cách xác trung th c, t t c tài li u tham kh o, cơng trình nghiên c u c i c s d ng c ghi rõ ngu c li t kê t im t danh m c tài li u tham kh o c a khóa lu n nh Nh ng c i ti thu t l nc a nh th c nghi m t thi t k khơng có s chép cơng trình c i khác N th t, xin ch u hình th c k lu t cao nh t c ng Hà N i, ngày 30/4/2015 Sinh viên Nguy n Hà Thanh L IC c tiên, em mu n g i l i c c nh n th y Nguy n Vi t Hà, th y Nguy n g i ý cho em m ng nghiên c u r t thú v t ng d n ng l i khuyên kinh nghi m quý báu cho em trong q trình th c hi n khóa lu n l ic n th y tác gi tài "Nghiên c u phát tri n m t s s n ph m thi t y u v x lí ti n ti ng Vi t" (VLSP), nh t o n n móng quan tr ng cho vi c ti p c n x ngôn ng ti ng Vi t E cg il ic i tác gi c a báo, nghiên c u có liên quan Trong khoa h c nói chung khoa h th c it s nghiên c u nghiên túc t n tâm c a tác gi , cách ti p c n, x v it i cách ti p t n hi u qu th gi i hi n Hà N i, ngày 30/4/2015 Sinh viên Nguy n Hà Thanh M CL C M TV 1.1 B I C NH NGHIÊN C U 1.2 NHI M V C A KHÓA LU N 1.3 CÁC N I DUNG C A KHÓA LU N THUY T 2.1 T NG QUAN V M 2.2 S O D NG VÀ HU N LUY N M O 2.3 2.4 M C A NGÔN NG TI NG VI T .10 XU T M 12 3.1 BÀI TOÁN 12 3.2 CÁC NGHIÊN C C K TH A 13 3.3 XÂY D NG KHÔNG GIAN VECTOR T 14 3.3.1 T ng quan cách ti p c n .14 3.3.2 Thu th p ti n x d li u 15 3.3.3 Xây d ng m 3.3.4 Hu n luy n m ng hi u ch nh vector t 17 15 3.4 M 18 3.4.1 Phân tách cú pháp b ng ph thu c 18 3.4.2 Xây d ng m 3.4.3 Hu n luy n m 3.5 thu c 19 m .21 M M NH, H N CH 3.5.1 3.5.2 m m nh c H n ch c 21 21 22 TH C NGHI M, K T QU 23 4.1 CÔNG C NG TH C NGHI M .23 4.1.1 Win web crawler - 4.1.2 vnTokenizer - công c tách t ti ng Vi t .23 4.1.3 vndp - công c khai tri n ph thu c ti ng Vi t .24 4.1.4 c nghi m t thi t k tri n khai .25 4.1.5 ng th c nghi m 27 4.2 D y n i dung c a trang web .23 LI U DÙNG CHO TH C NGHI M 27 4.3 CÁCH TH C T CH C TH C NGHI M .28 4.4 K T QU TH C NGHI M 29 4.5 T QU TH C NGHI M .30 K T LU N 32 TÀI LI U THAM KH O 34 M 1.1 TV B I C NH NGHIÊN C U Xã h i phát tri n, ch ng cu c s ng c cao nhu c u s d ng pháp lu t c a cá nhân, t ch c C ng hòa xã h i ch quy n co i, quy i hi pháp lu n c a công dân t l n n a cho th y v trí vai trò c a is theo pháp lu c nâng t gia nh v c kh cho m t s phát tri n nhanh nh, m t xã h i ho ng nh có th s d ng áp d ng pháp lu t, nh i làm ngành ph cr t nhi u liên t c c p nh t thông tin t n pháp lu t m c thơng qua Các n pháp lu i sau có hi u l c thay th , ph nh ho c b n c hi n di n r ng xuyên liên t c gây tr ng i l n cho nh i ho ng pháp Nh i dù hành ngh tin nh ng bi t v m t v pháp a hay không n u h không tra c u v m t th i gian dài Bên c b o hi n c a h th ng pháp lu t Vi t Nam nhi u b t c p v n nh m ch ng chéo mâu thu n gi a n quy ph m pháp lu t T i th m khóa lu c hoàn n quy ph m pháp lu t v thu cs i Th i báo kinh t n vi t: n v thu o h th b n quy ph m pháp lu t ch ng chéo, ch ng th c hi n Ch ng h bi nh c a Lu t Thu TNDN hi u l c thi hành quy nh c th ng th c hi n ph i so sánh Lu t Thu Lu t S i, b sung m t s u c a Lu t Thu tS i, b sung m ts u t i lu t thu c ngh nh s a nhi u ngh a nhi http://www.thesaigontimes.vn/125339/Ma-tran-van-ban-phap-luat-ve-thue.html 3.4.3 Hu n luy n m ng m hu n luy n m ng dung c a m t ch Ta g i , ta thi t l p b , m i b g m câu th hi n n i nh lu t giao thơng bi n th c tồn b n luy n, n luy n t p bi n th c a câu lu t giao thơng (bao g m nó) Hàm m c tiêu c n t i thi u là: Hàm m c s d ng vector h tr (SVM), tham s Stochastic gradient descent bi n m ng m so v i c ct m c c a thu t tốn c a có d ng m t siêu ph ng có kh ct c t i thi u, c 3.5 PHÂN TÍCH 3.5.1 ng hàm c a mơ hình máy Khi hàm có tích vơ M M NH, H N CH m m nh c t cách khách quan, có th th ts - - c xu t mm c m t cách ti p c n phù h p, gi i quy c yêu c u c a toán nghiên c u Gi i quy c v phát sinh thao tác v i ngôn ng ti ng Vi t lu n c bi t gi i quy t m t cách t t nh t v i ng Vi t b ng cách s d ng vector t c hu n luy n g n v i ng c nh s d ng ph thu c K th a nh ng t nh ng nghiên c u m i nh c qu c t v c x ngôn ng t nhiên x ngôn ng t nhiên ti ng Vi t c a nhà khoa h c có uy tín 21 3.5.2 H n ch c Bên c nh nh - H n ch c nhân t cho ho mm có th ho n t i m t s h n ch n ch c a mơ hình m ng ng xác, m ng nhân t o c n nhi u tài luy n hu n luy n, chi phí v m t th i gian, tính tốn b nh ng hu n luy n - xác c tách t ti ng Vi - Vi gi i h n b m c a ti ng Vi i v i d li u ti xác c a c thu c (~80%) áp d ng nghiên c u c khoa h c ch c ch n 22 c TH C NGHI M, K T QU 4.1 CÔNG C VÀ NG TH C NGHI M 4.1.1 Win web crawler - y n i dung c a trang web c, m ch m li u hu n luy n M ng tính khơng có giá tr n tài ho xu t ng tr c ti p v i d li u t v ng ti ng Vi t nên yêu c li u thu th c c n th a mãn nh ng tiêu chí v khách quan c nh ng tiêu chí v d li cs d l n, tính bao ph , tính ng u nhiên y, ngu n d li u v t v ng giao thông11 c l y t nh trang web ch n pháp lu t12 Cơng trình s d trang web http://www.winweb làm cơng c tk ch chóng T p t v cl yt t yêu c u v bao ph , tính ng u nhiên tính khách 10.9MB iv id c cung c p mi n phí thu th p d li u t v ng p t v ng m t cách nhanh ch , quan T ng c x tách t 4.1.2 vnTokenizer - công c tách t ti ng Vi t a ti ng Vi t, b công c tách t yêu c u không th thi u n u mu n thao tác v i d li u ti ng Vi t Công c tách t ti ng Vi t s d tài vnTokenizer 13 c a tác gi Lê H s d ng k t h p t n c hu n luy n s d ng treebank ti ng Vi t (70,000 câu c tách t ) v Tác gi c m xác 97%14 p c file nh phân mã ngu n c a công c cho u khoa h c Công trình s d ng tr c ti p mã ngu n c a cơng c có 11 http://www.vovgiaothong.vn, http:// www.gttm.go.vn,http://www.mt.gov.vn, http://www.baogiaothong.vn http:// thuvienphapluat.vn, http://www.vanban.chinhphu.vn 13 http://mim.hus.vnu.edu.vn/phuonglh/softwares/vnTokenizer 14 thu tài KC01.01/06-10 "Nghiên c u phát tri n m t s s n ph m thi t y u v x lí n ti ng Vi t" (VLSP) 12 ti 23 th tùy bi n ch u vào c a m ng ki m th c v cho nhu c u c n hóa file , chu n hóa t u vào c a ph thu c hay sinh b n cho m Công c xong r xác 97%, m c s d ng áp d ng vào th c nghi m c i ví d a công c t v i x thơng, ví d thành t tính_t ng tính t xác r t cao tài, cơng c có m_v a câu lu t giao ng c ng có xác su t cao t o ng giao ph m vi mét tính t y kh c ph c nh ng t n t i nh c nghi m c c chu n hóa l i d li m b o không x y l i trình hu n luy n m ng 4.1.3 vndp - công c khai tri n ph thu c ti ng Vi t15 a tác gi Dat Quoc Nguyen, Dai Quoc Nguyen, Son Bao Pham, Phuong-Thai Nguyen Minh Le Nguyen thu c tài Mã ngu n c c cung c p mi n phí cho m c t p nghiên c u khoa h c, vi c s d ng công c c thông qua s ng ý c a tác gi m c a công c m i l n ho ng, công c m t m t kho ng th i gian n p b d li ng 160MB r i m i có th ho c, bên c nh ch h tr vi c ghi t t c s d ng mã ngu n c a công c t ph n c m v tách câu s làm gi m t c a i gian n p d li tr ph i giao ti p v ng V i d li u kh ng l mà m i tính tốn vi c gi m t cho m ys d n t ng th i gian vơ ích c vơ l ng i vi c ta ph i ch n có m t m ng t t v i hàm giá h i t 15 http://vndp.sourceforge.net/ 24 a công c khai tri n ph thu c ti ng Vi xu t cách gi i quy t ti n hành khai tri n t t c câu t p hu n luy n t p ki m th n hành phân tích t p k t qu r n m k bên giá tr c ng M i l d li c n th c hi n vi c truy v n ph thu c t t thu c tính n luy n hay tính d li u ch không c n ph i khai tri n ph thu c n a 4.1.4 c nghi m t thi t k tri n khai Hình 4.1 B trí mã ngu n c Do m c nghi m tri n khai c xu t cơng trình, nh m ch nc c thi t k r n ch cho ch n thi t t i thi tri c thu t toán, khơng có thi t k giao di i dùng c vi t b ng java v i IDE Netbean, v c u trúc mã ngu m gói (package) chính, m i gói ph trách ho ng c a m t m c thi t k theo th c th c nh c t xu t (bao g m câu, t , ph thu c, tr ng s , vector) l p h tr khác 25 Hình 4.2 Các l p c c nghi m T i hàm main() c a a ch c li t kê, m i l a ch n s tri n nhánh th c hi n m t nhi m v c th 16 l a ch m: B ng 4.1 Danh sách tham s ch STT L a ch n iv im v ng NORMALIZE_VOCAB_FILE Tách t , chu n hóa t p t v ng UPDATE_VOCAB B sung t v ng t t INITIALIZE_WEIGHT Kh i t o tr ng s CSDL CALCULATE_IDF_WEIGHT Tính tr ng s d li u c a m tính giá tr tr ng s trung bình TEST_AVARAGE_DOC Tính giá tr tr ng s trung bình ph c v cho vi m câu ng c nh toán c c TEST_LOCAL_SCORE Ki m th vi b TEST_GLOBAL_SCORE Ki m th toàn c c TRAIN_VOCAB Hu n luy n m 26 vi m câu ng c nh c c m câu ng c nh vector hóa t v ng iv im ms a câu INITIALIZE_WEIGHT_SENTENCE Kh i t o tr ng s CSDL 10 SENTENCE_TO_DTREE Chuy n câu thành d ng ph thu c d li u 11 TEST_SCORE_SENTENCE Ki m th vi 12 TEST_TRAIN_SENTENCE Ki m th vi c hu n luy n (ki m tra ng h i t c a hàm giá thông qua ví d c th ) 13 TRAIN_SENTENCE Ti n hành hu n luy n m ng d a t p hu n luy n th t 14 TEST_CLOSEST_SENTENCE Ki m th vi truy v n 15 SENTENCE_TO_DTREE_TEST_DATA Chuy n câu t p ki m th thành d ng ph thu d li u 16 ANALYZE_TEST_RESULT t qu u cho m ch y v i d li u ki m th 4.1.5 c a m ms i v i câu ng th c nghi m c nghi c ch y h u hành Windows (64 bit), máy tính xách tay cá nhân có c - B vi x lý: Intel(R) Core(TM)i5-2410M CPU: 2.30 GHz Ram: 4GB H th ng: 64 bit 4.2 D LI U DÙNG CHO TH C NGHI M ph c, d li u y u t h t s c quan tr i v i tính h u d ng c a m t m ng m b o th a mãn nh ng tiêu chí v l n, tính bao ph , tính ng u nhiên khách quan cho m ng on hu n luy n vector t , d li c l y t website v giao thông16 16 17 n pháp lu t17 http://www.vovgiaothong.vn, http:// www.gttm.go.vn,http://www.mt.gov.vn, http://www.baogiaothong.vn http:// thuvienphapluat.vn, http://www.vanban.chinhphu.vn 27 iv im ns a câu, ng c nh c c gi i h n khuôn kh lu t giao thông Vi t Nam, d li u hu n luy n cs d tài nh Richard Socher i d li u th c nghi ng tác gi Vi c gi i h n ng c thi c a công trình t u ki n hi n t i D li u hu n luy n g m 110 b g m câu c xáo tr n v tr t t t D li u hu n luy c s d ng cơng trình c a t l n cho tính kh mb pháp ti ng Vi t c chia làm ph n, 75 b s d ng cho vi c hu n luy n m ng c a m ng T 75 b c a t p d li u h li u h c 35 b s d ng cho vi c ki m th ch ng c 550.000 b ba ví d ch a i hai câu l i, b c a m ng c trình bày s c tr n ng u nhiên nhi m v c c Các b c t o u vào c s d ng ki m th b v i 4.3 CÁCH TH C T CH C TH C NGHI M Quá trình th c nghi li u, Hu n luy n m c t ch c: Thu th p d li u, Ti n x d xác c a m T u tiên, d li u v t v c thu th p m t cách t ng b ng p d li c 9.2MB D li u v b c a câu th hi n lu c thu th p t c ng tác viên thông qua m t c xây d ng t m, ph c v riêng cho m p li u cho khóa lu n c thu th p, d li c ti n x lý, trình bao g m vi c tách t , chuy n câu sang d ng ph thu c, chuy n thông tin d ng s v m t t th hi n c r t quan tr c ti n hành hu n luy n d li u c hu n luy n m v ng s d ng m u tiên hu n luy n m có kh n c nh u tiên s d ng m t l p n ch a p vào g m 10 vector t x p c nh nhau, m i vector t ch a 10 ph n t l p ng giá tr m c a chu i 10 t Quá trình th s d ng m quy có l p n l u có 10 ph n t C u s d ng thu t 28 toán Stochastic Gradient Descent v i h s h c 10-5 vòng ngày, q trình th c ch y liên ti p vòng c ch y liên ti p c h th 4.4 K T QU TH C NGHI M c mơ hình, 175 câu (t 35 b V i m i câu, h th ng s tìm nh ng câu g v i nh t d c r i x p h ng t xu iv m g ng ki m th ng th ng ghi l i th h ng c a câu g n nh t thu c m t b (g i mean rank) Giá tr mean rank nh ch ng t m ng n ron ho t ng v i ví d ó xác ng c a m c a k t qu c hu n luy n B ng 4.2 li t kê m t s ví d u B ng 4.2 M t s k t qu u ví d Câu phát bi u v lu t giao thông lu ng b ph m vi an toàn c cd Mean Rank xe ng s t n giao thông ng, hè ph trái quy nh lu ng b không cho phép s d ng, l ng, hè ph trái phép không kéo lê hàng hóa m nghiêm c m d ng 0 ng c a xe buýt lu ng b xe mô tô ba bánh, xe g u n xe mô tô hai bánh, ng dành 11 71 n khác nghiêm c m d c ng tr s nh (c th c c ng ph m vi mét hai bên ch c 141 c ch ng m xu t cách i th ng kê tý l câu t p d li u ki m th có s mean rank ng h p mean rank = 0, mean rank < mean rank < 10) B i i k t qu th s d ng m 29 li u ki m th B ng 4.3 B ng th ng kê mean rank ng h p S ng h p T l % Câu b n m c a b ng x p h ng 48/175 27,43% Câu b n m top c a b ng x p h ng 86/175 49,14% Câu b n m top 10 c a b ng x p h ng 115/175 65,71% qu Xét c t p d li u ki m th , giá tr mean rank trung bình 14,1 Nhìn vào k t u c a m trình kh o sát g r t m ng, có th th y m ng ho k t qu ng t t v i nh i v i câu ng n dài trung bình (t 6-10 t ) M hi n ho c dài , v i nh ng câu ng n, ph thu sâu th p tr nên không linh ho t vi c c p nh t tr ng s m ng trình hu n luy c l i, ph thu c sinh b sâu l ng x ng h p tràn b nh i v i tr ng s , d n tình tr ng h i t o Ngoài ra, k t qu phân lo i c a m i v i nh ng câu rút g n (khuy t ch ng ) i nh ng câu có c 4.5 T QU TH C NGHI M D a vào k t qu th c nghi m, ta có th th y m ho ng i t t v i t p d li u hi n t i T l x p h ng, top top 10 l t 27,43% ; 49,14% 65,71% t tr ng s c a m ct ng hàm m v m c c tr , t l l t nhi u l n so v i vi c x p h ng ng t xác u b ng u ch ng it d n iv i câu Cơng trình s d ng m i báo Semantics for Finding and Describing Im c a Richard Socher, Andrej Karpathy, Quoc V Le, Christopher D Manning, Andrew Y Ng (2013) M c dù x d a ngôn ng ti ng Vi t, v i th i gian, d li u h n ch xác b gi i h nb xác c a công c x ngôn ng ti ng Vi d ng trình v n có giá tr mean rank ng 14.1 Giá tr mean rank t b ng k t qu m ng n ron c xu t cơng trình c a Richard Socher ng tác gi 30 sinh m ts 18 i v i d li u ti ng Anh B Giá tr mean rank nh ch ng t mơ hình t t B ng 4.4 B ng giá tr mean rank c Richard Socher ng tác gi Mơ hình c kh o sát b i Gi i thích Mean Rank Random Mơ hình ng u nhiên 101.1 BoW Mơ hình Bag of word 11.8 CT-RNN Mơ hình s d ng m b phi u Recurrent NN Mơ hình m kCCA Mơ hình Kernel Canonical Correlation Analysis 10.7 DT-RNN Mơ hình m thu c quy v i ph 11.1 SDT-RNN Mơ hình m thu c ng quy v i ph 18 i quy v i i quy vòng 15.8 18.5 10.5 B ng l y t s li u công trình c a Richard Socher, Andrej Karpathy, Quoc V Le, Christopher D Manning, Andrew Y Ng (2013) 31 K T LU N Trong khn kh c a m t khóa lu n t t nghi t xây d ih c i quy t ph n n câu th hi n lu t giao thông u hi ng Bài toán nghiên c phát tri n ng d ng công ngh c pháp sau này, giúp phát hi n, lo i b s ch ng chéo h th ng pháp lu t Vi t Nam h tr h u ích cho nh c pháp ng ti p c h c máy u gi i quy t v ng s d ng k thu c nghi m c tài phù h a cơng trình o c nh ng k t qu thuy t, xu t cm c ti n xây d c m t h th ng ho i hi u qu v i d li u ti ng Vi t d a nh ng công c , nghiên c m t s c i ti n v k thu t K t qu nghiên c u c tài không ch gi i h n lu t giao thơng mà có th ng d ng r tài liên n x ngôn ng t nhiên ti ng Vi t khác Bên c n m t s m có th hồn thi n nghiên c u ti p theo có m t cơng trình hồn ch nh h n: - Th nh t, m i dùng có th tham gia c i thi n vi c h c c a h th ng s giúp t ng ch t l ng phân lo i c a m ng n ron Th hai, d li u hu n luy n nghèo nàn, v n nhi u khâu ph i nh p d li u th công Th iv im ns dài l tràn tìn hi u Th l ph i ngơn ng phù h p nh t mơ hình m T nh ng phân tích nêu trên, c - - o xu t c i thi n h th ng bao g m: Thi t k m t ng d ng web hoàn ch nh ph c v i dùng s d ng i dùng làm y u t u vào c a m c i ti n vi c h c c a m ng Thi t k l iv im có th gi i quy c c nh ng dài l n 32 - Nghiên c u xây d ng m d ng ngôn ng chuyên d Mathlab, Python 33 TÀI LI U THAM KH O Ti ng Anh [1] Machine learning course - Stanford University , https://class.coursera.org/ml-005/lecture Last visited: April 2015 [2] Collobert, Ronan, and Jason Weston "A unified architecture for natural language processing: Deep neural networks with multitask learning." InProceedings of the 25th international conference on Machine learning, pp 160-167 ACM, 2008 [3] Huang, Eric H., Richard Socher, Christopher D Manning, and Andrew Y Ng "Improving word representations via global context and multiple word prototypes." In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics: Long Papers-Volume 1, pp 873-882 Association for Computational Linguistics, 2012 [4] Nguyen, Dat Quoc, Dai Quoc Nguyen, Son Bao Pham, Phuong-Thai Nguyen, and Minh Le Nguyen "From treebank conversion to automatic dependency parsing for vietnamese." In Natural Language Processing and Information Systems, pp 196-207 Springer International Publishing, 2014 [5] Richard Socher, Andrej Karpathy, Quoc V Le*, Christopher D Manning, Andrew Y Ng., rounded Compositional Semantics for Finding and Describing Images Transactions Of The Association For Computational Linguistics, 2, 207218 [6] Socher, Richard, Cliff C Lin, Chris Manning, and Andrew Y Ng "Parsing natural scenes and natural language with recursive neural networks." InProceedings of the 28th international conference on machine learning (ICML-11), pp 129-136 2011 [7] Socher, Richard, Alex Perelygin, Jean Y Wu, Jason Chuang, Christopher D Manning, Andrew Y Ng, and Christopher Potts "Recursive deep models for semantic compositionality over a sentiment treebank." In Proceedings of the conference on empirical methods in natural language processing (EMNLP), vol 1631, p 1642 2013 [8] Socher, Richard, Brody Huval, Christopher D Manning, and Andrew Y Ng "Semantic compositionality through recursive matrix-vector spaces." InProceedings of 34 the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, pp 1201-1211 Association for Computational Linguistics, 2012 [9] Thi, Luong Nguyen, Hung Nguyen Viet, Huyen Nguyen Thi Minh, and Phuong Le Hong "Building a treebank for Vietnamese dependency parsing." InComputing and Communication Technologies, Research, Innovation, and Vision for the Future (RIVF), 2013 IEEE RIVF International Conference on, pp 147-151 IEEE, 2013 Ti ng Vi t n Anh, X ngôn ng ti ng Vi t, http://viet.jnlp.org/ Truy c p l n [10] cu i Th 11, 2014 [11] Hi c C ng Hòa Xã H i Ch t Nam, NXB Chính tr Qu c gia, 2013 [12 th c ti ng vi t c Di M ts vi t n vi c nh n , http://www.ued.edu.vn/khoavan/mod/resource/ view.php?inpopup=true&id=59 Truy c p l n cu i: Th4, 2015 [13] GS TS Nguy n pháp Vi t Nam, NXB ng Dung & TS Nguy n Minh Tu n, Giáo trình Lu t hi n i h c Qu c gia Hà N i, 2014 [14] H th ng V n b n Quy ph m pháp lu t, NXB H ng c, 2013 n, Giáo trình tin h [15] n Qu c & Qu c gia Hà N i, Hà N i, 2006 tr.7 , ih c c C n, Nh p môn ngôn ng h c, NXB Khoa h c xã [16] h i, Hà N i, 2009 [17] n, n n pháp lu t v thu , http://www.thesaigontimes.vn /125339/Ma-tran-van-ban-phap-luat-ve-thue.html, Truy c p l n cu i: Th4, 2015 [18] lí ti tài KC01.01/06-10 "Nghiên c u phát tri n m t s s n ph m thi t y u v x n ti ng Vi t" (VLSP) thu c Công ngh c p c KC01/06-10 35 ... TOÁN Nhi m v c tài khái quát c s lý thuy t, k th a nh ng nghiên c u ã có, xu t gi i pháp xây d cm n nh ng c p câu lu t giao thông Vi tài s d ng lu c nh, gi i h c th hi cb t v ng ng áp d ng nghiên. .. ng x lý pháp lu t sau Nhi m v c tài khái quát c s lý thuy t, k th a nghiên c u ã có, xu t gi i pháp xây d cm phát hi c nh ng c p câu lu v y m t ng c c gi i h n quy ph m pháp lu nh v giao thông. ..I H C QU C GIA HÀ N I I H C CÔNG NGH NGHIÊN C U XÂY D NG NG D NG X N LU T GIAO THƠNG KHĨA LU N T T NGHI I H C H CHÍNH QUY Ngành: Công ngh thông tin Cán b LÝ ng d n: PGS TS Nguy n Vi t Hà - 2015

Ngày đăng: 18/03/2018, 22:55

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan