... đặt đề bài " khỏc ca bi vit trờn:
ã phuongthucbieudatbai tieng noi cua van nghe
ã soanbai khi con tu hu ngu van 8
ã xem phuongthucbieudat cua bai tho khi con tu hu,
... đầu đình
Em xinh em đứng một mình cũng xinh.
(Ca dao)
đ) Nếu ta đẩy quả địa cầu quay quanh trục theo hướng từ tay trái sang tay phải mà chúng ta gọi là
hướng từ tây sang đông thì hầu hết các ... điểm trên bề mặt quả địa cầu đều chuyển động, đều thay đổi vị trí
và vẽ thành những đường tròn.
(Theo Địa lí 6)
Gợi ý: Mục đích giao tiếp của các văn bản:
a) Kể lại chuyện Tấm bị Cám lừa lấy hết...
... chiều là làm tăng sự khó khăn trong bài toán đánh giá với số
chiều d của không gian, theo nguyên tắc, sẽ tăng theo hàm mũ với số mẫu của
các đặc tính của không gian. Việc này bao gồm một bài toán ... tắt
Từ Tiếng Anh Tiếng Việt
CSDL
Database Cơ sở dữ liệu
DF
Document Frequency Tần xuất tài liệu
ERM
Empirical Risk Minimization Tối thiểu hoá rủi ro theo kinh
nghiệm
IG
Information Gain ... nhận thông tin
KDD
Knowledge Discovery in Database Khai phá tri thức trong CSDL
KNN
K Neighbourhood Nearest K láng giêng gần nhất
ODM
Oracle Data Mining Khai phá dữ liệu Oracle
SVM
Support...
... Language and Culture, College of Foreign Languages,
Vietnam National University, Hanoi, Pham Van Dong Street, Cau Giay, Hanoi, Vietnam
Frequency uses of negative words and negative sentences ... thân. Cứ
ở nhà này.
- Không.
- Thế thì tôi đi với mợ.
(Nó sợ hãi) - Không.
(sđd: Diệp Quang Ban, 2004) [7]
2.2.2. Sử dụng phươngthức suy luận để tri nhận
A. Phủ định bằng phươngthức không ... hy vọng
thực hiện được công việc. Ngữ nghĩa trong
các cấu trúc hình thức trên được giải thích
theo nội dung nhà nghiên cứu ngữ pháp
tiếng Hán Chu Đức Hi (Trung Quốc) đã tổng
kết như sau: 1....
... khổ
thân. Cứ ở nhà này.
-Không.
-Thế thì tôi đi với mợ.
Nó sợ hÃi -Không.
(sđd: Diệp Quang Ban, 2004)
[7]
2.3.2. Sử dụng phơng thức suy
luận để tri nhận
58
và khác nhau trong ... lại hy vọng thực hiện đợc
công việc. Ngữ nghĩa trong các cấu trúc
hình thức trên đợc giải thích theo nội
dung nhà nghiên cứu ngữ pháp tiếng
Hán Chu Đức Hi (Trung Quốc) đà tổng
kết nh sau: 1.Hễ ... xảy
ra, bèn nói giọng buồn bÃ:
quả đó suýt nữa không vào lới:
đà vào lới, không thể hiểu theo nghĩa
là: không vào lới đợc). Điều này đòi
hỏi chúng ta cần xem xét kỹ càng hơn
đặc trng...
... KHOA HỌC: PGS. TS ĐOÀN VĂNBAN
HÀNỘI-NĂM2013
19
khụngcúimdliunonmtrongl,tacúcỏciukinsau,vimiita
cú:
wx
i
+b1ivix
i
thuclpthnht.
wx
i
+b-1ivix
i
thuclpthhai.
Tacúthvitgnlinhsau:y
i
(wx
i
+b)1vi1in.
Vytacúbitoỏntiuhúasau:
... thìcây
quyếtđịnhcầnkiểmtraxemngườiđócósởhữubaonhiêuxehơi(CarOwnership).
Nếusốxehơisởhữulà0thìngườiđósẽchọnxeBuýt,nếusốxehơisởhữulà1
thìngườiđósẽchọnTàu. Theo câyquyếtđịnhhình2.4,cácluật(SeriesofRules)
đượcsinhratừcâyquyếtđịnhdùngđểdựđoánnhưsau:
Rule1:NếuTravelcost/kmlàđắtthìmode=ôtô
Rule2:NếuTravelcost/kmlàtrungbìnhthìmode=tàu
Rule3:NếuTravelcost/kmlàrẻandgenderisnamthìmode=xebuýt
Rule4:NếuTravelcost/kmlàrẻandgenderlànữvàkhôngsởhữuôtôthì
mode=xebuýt
Rule5:NếuTravelcost/kmlàrẻandgenderlànữvàsởhữuôtôthìmode=
tàu
Dựavàocácluậtnày,việcdựđoánlớpcho cácdữliệuchưabiết (unseen
datahayTestingdata)rấtđơngiản.Trongvídụnày,Ancógiátrịcủathuộctính
TravelCost/Kmlàtrungbìnhnênsẽchọnphươngtiệnlàtàu(Rule2)màkhôngcần
quantâmđến ... Cácthuộctính
1 2
, , ,
n
x x x
độclậpxácsuấtđôimộtvớinhau.
Theo địnhlýBayes:
P(X | ).P( )
( | )
( )
i i
i
C C
P C X
P X
Theo tínhchấtđộclậpđiềukiện:
1 2
1
( | ) ( | ) ( | ) (...
... đó làm cho việc tính toán NB hiệu quả và nhanh chóng hơn các
phương pháp khác với độ phức tạp theo số mũ vì nó không sử dụng việc kếp hợp
các từ để đưa ra phán đoán chủ đề.
2.2.4.2. Công thức ... đích chính là tính được xác suất
Pr( , )
Cj d
′
, xác suất để vănbản
d
′
nằm
trong lớp
Cj
. Theo luật Bayes, vănbản
d
′
sẽ được gán vào lớp
Cj
nào có xác suất
Pr( , )Cj d
′
cao nhất. ... chớnh xỏc trờn 97% [inh in et al, 2001]
ắ Mụ hỡnh cho kt qu phõn on t vi tin cy (xỏc sut) kốm theo.
ắ Nhờ có tầng mạng neural nên mô hình có thể khử nhập nhằng các trường hợp
tầng WFST cho...
... sinh khi biểu diễn vănbảntheo hướng vector đặc trưng chính là
việc chọn đặc trưng và số chiều cho không gian. Cần phải chọn bao nhiêu từ và
chọn những từ nào ? theo những cách nào ? Có nhiều ... tin tức điện tử Do đó mà số lượng vănbản xuất hiện trên
mạng Internet cũng tăng theo với một tốc độ chóng mặt. Theo số lượng thống kê từ
Broder et al (2003), lượng thông tin đó lại tăng gấp ...
dictionary) chỉ chứa các thành phần của từ và ngữ như hình vị và các từ đơn giản
trong tiếng Hoa.
Tùy theo cách chọn để khớp từ (match), hướng tiếp cận “full word/ phrase” có
thể được chia ra thành...
... liệu.Tuỳ theo yêu cầu ràng buộc cụ thể của bài toán mà ta
sử dụng các mô hình biểu diễn vănbản cho phù hợp.
2.6 Áp dụng phương pháp véc-tơ thưa trong lưu trữ văn bản
Khi biểu diễn vănbảntheo mô ... đề
j
C
2. Tính tổng số từ của mỗi lớp
j
C
3. Tính xác xuất của chủ đề
j
C
đối với vănbản d theo công thức
4.
( )
i
P C d
=
1 2
( ( | )* ( | )* * ( | ))
j j m j
P word C P word C P word C
*(Tổng ... thử nhất. Lớp của vănbản thử
chính là lớp mà véc-tơ trọng tâm đại diện. Khoảng cách được tính theo độ đo cosine.
():
1. Tính trọng tâm
i
C
của lớp thứ i
2. Tính độ tương đồng
*
cos(...
... (Joachims, 1998).
Dữ liệu huấn luyện và kiểm thử
Kt qu thc nghim
ã
D liu hun luyn (data train) và kiểm
thử (data test) được sử dụng gồm 4936
tài liệu được lấy từ trang http://
vnexpress.net. ... vi SVM (tip)
ã
B phõn loi SVM c nh ngha:
ã
Trong ú
ã
Nu f(x)=+1 thỡ x thuc v lp dng (lnh vc c quan tõm)
ã
Nu f(x)=-1 thỡ x thuc về lớp âm (các lĩnh vực khác)
( ) (w )
T
f x sign x b= +
( )...
...
Thoi gian tim tap pho bien
0
2000
4000
6000
3000 4000 5000
So van ban
So giay
70%
80%
90%
Hình 3.Biểu đồ phân tích thời gian xử lý theo số vănbản và ngưỡng minsupp
Độ chính xác của kết quả ... binary and fuzzy association rules from
database
, In Proc of AFSS2000 intl. Conf on Fuzzy Set and Application, Tsukuba,
Japan, pp 981-986
[4]. Diệp Quang Ban, Hoàng Văn Thung (2000), Ngữ pháp ... lập với ngôn ngữ. Phương pháp
xử lý của QTAG có thể mô tả tổng quát như sau. Nó được xây dựng theo tiếp cận máy học từ
kh
ối ngữ liệu học đã được gán nhãn bằng tay. Dựa vào những dữ liệu đã...