Ứng dụng khai phá dữ liệu xây dựng hệ thống phân tích hoạt động đầu tư trong thị trường chứng khoán

25 663 0
Ứng dụng khai phá dữ liệu xây dựng hệ thống phân tích hoạt động đầu tư trong thị trường chứng khoán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HUỲNH ĐỨC THUẬN ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG HỆ THỐNG PHÂN TÍCH HOẠT ĐỘNG ĐẦU TƯ TRONG THỊ TRƯỜNG CHỨNG KHỐN TĨM TẮT LUẬN VĂN THẠC SĨ KĨ THUẬT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 ĐÀ NẴNG, NĂM 2010 MỞ ĐẦU LÝ DO CHỌN ĐỀ TÀI Khám phá tri thức (KPTT) hay khai phá liệu (KPDL) trTong sở liệu (CSDL) ñang xu hướng quan trọng cơng nghệ thơng tin (CNTT) giới KPTT có khả ứng dụng vào nhiều lớp toán thực tế khác Lĩnh vực tài nói chung thị trường chứng khốn (TTCK) nói riêng lưu trữ khối lượng liệu khổng lồ, bao gồm thông tin mã cổ phiếu, thông tin giao dịch khối lượng giao dịch rịng, thơng tin liệu khách hàng… Ứng dụng sinh luật kết hợp từ KPDL ñể phát quy luật ẩn chứa khối lượng liệu khổng lồ mang lại cho nhà ñầu tư nhiều hội ñể chọn lựa loại cổ phiếu cần đầu tư, có hình thức quy mơ giao dịch phù hợp nhằm đạt giá trị gia tăng hiệu Tuy nhiên, bối cảnh việc ñầu tư vào TTCK Việt Nam có nhiều khó khăn: lượng thơng tin nhiều khơng hợp nhất, chuyển biến khó ñoán trước diễn biến TTCK, phần mềm trợ giúp chưa phù hợp với môi trường TTCK Việt Nam… Đó khó khăn cần trợ giúp cho nhà đầu tư phân tích hoạt động ñầu tư phù hợp TTCK MỤC TIÊU NGHIÊN CỨU Xuất phát từ lý tơi thực ñề tài: "Ứng dụng khai phá liệu xây dựng hệ thống phân tích hoạt động đầu tư thị trường chứng khốn” Mục tiêu đề tài ñề xuất giải pháp ứng dụng KPDL ñể xây dựng hệ thống trợ giúp nhà đầu tư cơng tác phân tích hoạt động đầu tư cổ phiếu hợp lí TTCK cho mang lại hiệu kinh tế điều kiện 3 Nhiệm vụ đề tài đánh giá tính khả thi chức phân tích chứng tỏ cổ phiếu TTCK thay ñổi theo qui luật Nhiệm vụ thứ hai xem xét lí thuyết, thuật tốn phù hợp để áp dụng mơ hình phân tích hoạt ñộng ñầu tư phù hợp ñiều kiện ĐỐI TƯỢNG NGHIÊN CỨU Phân tích hoạt động đầu tư TTCK nội dung khó tính biến động, khơng ổn định khối lượng thơng tin, liệu thị trường ngày nhiều Trước ñây ñã có số luận văn ñề cập ñến KPDL ứng dụng ñối tượng ñơn giản trợ giúp kinh doanh, trợ giúp phân loại văn bản… Với ñề tài việc thu thập liệu xử lí chúng để đưa thơng tin hữu ích mang tính phức tạp nhập nhằng PHƯƠNG PHÁP NGHIÊN CỨU Để thực luận văn tiến hành nghiên cứu lý thuyết KPDL ??? ứng dụng thực tế sàn giao dịch chứng khoán BỐ CỤC LUẬN VĂN Bố cục luận văn bao gồm phần sau : phần mở đầu trình bày lý chọn đề tài, mục đích ý nghĩa mục tiêu nhiệm vụ ñề tài Trong chương một, luận văn tập trung giới thiệu TTCK nhiệm vụ phân tích hoạt ñộng ñầu tư cổ phiếu, chương ta tập trung tìm hiểu rõ TTCK Việt Nam, thơng tin cần sử dụng TTCK phục vụ cho mục đích, nhiệm vụ đề tài Chương hai tập trung vào phương thức dự báo cho TTCK: chương ta tìm hiểu luật kết hợp thuật toán Apriori nhằm giải vấn đề tiến hành phân tích TTCK tìm hiểu chương KPDL 4 Với thực tiễn khoa học ñược nêu chương hai, xây dựng hệ thống ứng dụng chương ba Đó hệ thống phân tích dự ñoán luật kết hợp KPDL: chương ta ứng dụng giải chương hai ñể xây dựng phần mềm tư vấn cho nhà ñầu tư Từ kết ñạt ñược, phần cuối luận văn nêu phép đo tính hiệu nghiên cứu, ñưa ñánh giá kết ñạt ñược, hạn chế ñề xuất hướng nghiên cứu CHƯƠNG : TÌM HIỂU THỊ TRƯỜNG CHỨNG KHỐN VÀ HOẠT ĐỘNG ĐẦU TƯ 1.1 TÌM HIỂU VỀ TTCK 1.1.1 Đặc ñiểm TTCK TTCK phong phú lĩnh vực ñầu tư, ña dạng chủng loại hàng hóa phức tạp qui luật đầu tư; nơi mua bán chứng khốn thường thực chủ yếu sở giao dịch chứng khoán, phần công ty môi giới 1.1.2 TTCK Việt Nam TKCK Việt Nam ñời 10 năm có ảnh hưởng to lớn đến kinh tế quốc gia Việc nghiên cứu xây dựng hệ thống phân tích dự đốn (nhiệm vụ tư vấn) cho TTCK quan trọng cấp thiết cho nhà ñầu tư nhà hoạch ñịnh sách vĩ mơ TTCK Việt Nam gồm hai sàn giao dịch: HOSE HASTC 1.1.3 Những rủi ro gặp phải nhà ñầu tư Các rủi ro thường gặp nhà đầu tư: rủi ro tính khoản thấp, rủi ro từ thông tin, rủi ro từ quy ñịnh chất lượng dịch vụ sàn giao dịch, rủi ro từ chấn ñộng thị trường 1.2 TÌM HIỂU PHƯƠNG PHÁP VÀ MƠ HÌNH PHÂN TÍCH HOẠT ĐỘNG ĐẦU TƯ 1.2.1 Tìm hiểu phương pháp phân tích hoạt động đầu tư Các phương pháp phân tích chủ yếu dựa vào bốn cách chính: dựa vào phân tích kỹ thuật để đưa tư vấn, dựa vào phân tích sở ñể ñưa tư vấn, dựa vào phương pháp dự báo chuỗi thời gian khứ dựa vào phương pháp máy học Trong phạm vi nghiên cứu ứng dụng luận văn tập trung vào phương pháp sử dụng tập liệu mẫu xem xét thay đổi theo thời gian để đưa phân tích dự đốn 1.2.2 Mơ hình hệ thống phân tích-dự đốn TTCK Thu thập liệu Đây trình lấy liệu từ nguồn internet, báo chí, thơng cáo… Phân tích ý nghĩa số Dữ liệu sau ñược thu thập chuyển ñổi phù hợp tiến hành phân tích đưa dự đốn Cung cấp thơng tin tư vấn cho nhà ñầu tư Dữ liệu sau ñược phân tích dự báo đươc cung cấp cho nhà đầu tư thơng qua giao diện thân thiện Tóm lại, mục đích luận văn tóm tắt sau: cho ti{i = 1, 2,…n} giá trị cổ phiếu S ngày thứ 1, 2, …, n, xác ñịnh ñược diễn biến cổ phiếu S ngày n + 1, n + 2, n + Q trinh mơ tả hình 1.1 Internet: Các nguồn khác Quá trình thu nhập liệu Quá trình KPDL CSDL Kho liệu Nhà quản trị Kho trithức Ứng dụng người dùng (Web, PC, Mobile…) Nhà đầu tư Hình 1.1 Mơ hình hệ thống phân tích dự đốn TTCK 1.3 CÁC THÔNG TIN LIÊN QUAN ĐẾN TƯ VẤN TRONG TTCK 1.3.1 Lí thuyết đầu tư Giới đầu tư dựa vào hai lí thuyết chính: Firm Foundation Castle in the Air Dự theo lí thuyết xác định thị trường định hình, hay nói cách khác cách nhà đầu tư nghĩ phản ứng trước thay ñổi số sóng đầu tư 1.3.2 Dữ liệu TTCK Dữ liệu bao gồm thông tin Web, thơng tin niêm yết cơng ty tham gia TTCK Ngồi nhà đầu tư cịn dựa vào loại liệu kĩ thuật, liệu sơ cấp liệu thứ cấp 1.4 PHÂN TÍCH TRONG TTCK 1.4.1 Xác ñịnh nhiệm vụ phân tích hoạt ñộng ñầu tư Nhiệm vụ tư vấn có hai mục đích Đó phân tích: dựa tất liệu khứ, để đưa phân tích số sẵn có, chẳng hạn: giá trị cổ phiếu tăng, nhà đầu tư khơng cịn đầu tư vào cổ phiếu này…những phân tích dựa số liệu thực tế nêu lại trạng cho loại cổ phiếu cho trước Từ phân tích đó, hệ thống tư vấn đưa dự đốn cổ phiếu có khả tăng lần giao dịch dựa luật kết hợp thuật tốn kèm theo 1.4.2 Khả phân tích hoạt động ñầu tư TTCK Khả tư vấn TTCK theo học thuyết khó theo EMH 1.4.3 Phương thức phân tích hoạt động đầu tư Chúng ta phân loại kỹ thuật sau: phương pháp phân tích kỹ thuật, phương pháp phân tích sở, phương pháp dự báo chuỗi thời gian khứ phương pháp máy học Tiêu chuẩn cho việc phân loại loại công cụ loại liệu mà phương pháp ñược sử dụng ñể dự báo thị trường Các nội dung chương tập trung giới thiệu TTCK Việt Nam, ñặc ñiểm giao dịch thông tin TTCK, cổ phiếu giao dịch Từ phân tích ban đầu TTCK, ta đưa nhiệm vụ luận văn, nhiệm vụ phân tích dự đốn xu hướng cổ phiếu kỹ thuật KPDL CHƯƠNG : TÌM HIỂU KHAI PHÁ DỮ LIỆU VÀ THUẬT TOÁN SINH LUẬT KẾT HỢP 2.1 MỞ ĐẦU Trong chương hai, tơi sâu vào phương pháp, kỹ thuật tư vấn thực tế thị trường chứng khóa, qua sử dụng kiến thức KPDL vào để phân tích dự đốn kết TTCK 2.2 KHAI PHÁ DỮ LIỆU (KPDL) 2.2.1 Các khái niệm Khi lưu trữ liệu khổng lồ thấy chắn chúng phải chứa giá trị định Tuy nhiên, theo thống kê có lượng nhỏ liệu (khoảng từ 5% ñến 10%) ln phân tích, số cịn lại họ khơng biết phải làm làm với chúng họ tiếp tục thu thập tốn với ý nghĩ lo sợ có quan trọng bị bỏ qua sau có lúc cần đến Mặt khác, mơi trường cạnh tranh, người ta ngày cần có nhiều thơng tin với tốc ñộ nhanh ñể trợ giúp việc định ngày có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa khối lượng liệu khổng lồ có Từ thực tế làm phát triển khuynh hướng kỹ thuật kỹ thuật phát tri thức khai phá liệu 2.2.2 Mục tiêu khai phá liệu Mục tiêu KPDL lấy thơng tin hữu ích từ lượng liệu khổng lồ 2.2.3 Các bước khám phá tri thức Gom liệu (Gathering) Tập hợp liệu bước q trình KPDL Đây bước ñược khai thác CSDL, kho liệu chí liệu từ nguồn ứng dụng Web Trích lọc liệu (Selection) Ở giai ñoạn liệu ñược lựa chọn phân chia theo số tiêu chuẩn đó, ví dụ chọn tất người có tuổi đời từ hai lăm đến ba lăm có trình độ đại học Làm sạch, tiền xử lý chuẩn bị trước liệu (Cleansing, Pre-processing and Preparation) Giai ñoan thứ ba giai đoạn hay bị lãng, thực tế bước quan trọng trình KPDL Một số lỗi thường mắc phải gom liệu tính khơng đủ chặt chẽ, logic Vì vậy, liệu thường chứa giá trị vô nghĩa khơng có khả kết nối liệu Ví dụ: tuổi = sáu trăm bảy mươi ba Giai ñoạn tiến hành xử lý dạng liệu không chặt chẽ nói Những liệu dạng xem thơng tin dư thừa, khơng có giá trị Bởi vậy, q trình quan trọng liệu khơng “làm - tiền xử lý - chuẩn bị trước” gây nên kết sai lệch nghiêm trọng Chuyển ñổi liệu (Transformation) Tiếp theo giai ñoạn chuyển ñổi liệu, liệu đưa sử dụng điều khiển việc tổ chức lại Dữ liệu ñã ñược chuyển ñổi phù hợp với mục ñích khai thác Phát trích mẫu liệu (Pattern Extraction and Discovery) Đây bước mang tính tư KPDL Ở giai đoạn nhiều thuật tốn khác sử dụng để trích mẫu từ liệu Thuật toán thường dùng nguyên tắc phân loại, nguyên tắc kết hợp mô hình liệu tuần tự, v.v Đánh giá kết mẫu (Evaluation of Result) Đây giai ñoạn cuối q trình KPDL Ở giai đoạn này, mẫu liệu chiết xuất phần mềm KPDL Khơng phải mẫu liệu ñều hữu ích, đơi cịn bị sai lệch Vì vậy, cần phải ưu tiên tiêu chuẩn ñánh giá ñể chiết xuất tri thức cần chiết xuất Trên sáu giai đoạn q trình KPDL, giai đoạn giai đoạn quan tâm nhiều hay cịn gọi KPDL 2.2.4 Phát vấn ñề KPDL Đây trình mang tính định tính với mục đích xác định ñược lĩnh vực yêu cầu phát tri thức xây dựng toán tổng kết 2.2.5 Các hướng tiếp cận KPDL Các hướng tiếp cận KPDL ñược phân chia theo chức hay lớp tốn khác Sau số hướng tiếp cận Hướng tiếp cận phổ biến phân lớp dự đốn, Một hướng tiếp cận hiệu sử dụng luật kết hợp, Một hướng tiếp cận dễ hình dung khai phá chuỗi theo thời gian, Một hương tiếp cận khó thực phân cụm Một hướng tiếp cận hiệu sử dụng luật kết hợp (association rules): dạng luật biểu diễn tri thức dạng ñơn giản Phương pháp nhằm phát luật kết hợp thành phần liệu CSDL Mẫu ñầu giải thuật KPDL tập luật kết hợp tìm 2.2.6 Nhiệm vụ KPDL Những nhiệm vụ khai phá liệu là: phân cụm, phân loại, phân nhóm, phân lớp ; khai phá luật kết hợp; lập mơ hình dự báo; phân tích đối tượng ngồi cuộc; phân tích tiến hóa 2.2.7 Các kỹ thuật KPDL Q trình KPDL q trình phát mẫu giải thuật KPDL tìm kiếm mẫu đáng quan tâm theo dạng xác ñịnh luật, phân lớp, hồi quy, phân nhóm,… Các phương pháp phổ biến thường phương pháp quy nạp, ñịnh luật, khai phá luật kết hợp, phương pháp phân lớp hồi quy phi tuyến, phân nhóm phân đoạn, phương pháp dựa mẫu, KPDL văn mạng neuron 2.2.8 Ứng dụng KPDL KPDL lĩnh vực ñược quan tâm ứng dụng rộng rãi Một số ứng dụng điển hình KPDL liệt kê: phân tích liệu hỗ trợ ñịnh; ñiều trị y học; phát văn bản; tin sinh học; tài TTCK; bảo hiểm 2.2.9 Những tồn KPDL Các tồn cần phải giải KPDL: liệu lớn; kích thước lớn; liệu động; trường liệu khơng phù hợp; giá trị bị thiếu; trường liệu bị thiếu; phù hợp; khả biểu ñạt mẫu; tương tác với người sử dụng tri thức sẵn có 2.3 KHAI PHÁ LUẬT KẾT HỢP 2.3.1 Tìm hiểu luật kết hợp Luật kết hợp dạng luật ñơn giản lại mang nhiều ý nghĩa Thông tin mà dạng luật ñem lại ñáng kể hỗ trợ khơng nhỏ q trình định Tìm kiếm luật kết hợp q mang nhiều thông tin từ CSDL tác nghiệp hướng tiếp cận lĩnh vực khai thác liệu 2.3.2 Định nghĩa Cho I={I1, I2, , Im} tập hợp m tính chất riêng biệt Giả sử D CSDL, với ghi chứa tập T tính chất (có thể coi T tập I), ghi có số riêng Một luật kết hợp mệnh đề kéo theo có dạng X => Y, X, Y tập I, thỏa mãn ñiều kiện : X giao Y = trống Các tập hợp X Y ñược gọi tập mục (theo tiếng Anh itemset) 2.3.3 CSDL giao dịch CSDL GIAO DỊCH (Transaction DB) hệ CSDL dùng cho mục đích khai phá liệu, ñược hình thành từ nguồn liệu gốc ñược chuyển đổi theo mục đích người sử dụng (ở ñây ñược chuyển ñổi từ CSDL quan hệ cổ phiếu ñược lấy từ nhiều nguồn khác nhau) 2.3.4 Giải thuật chuyển ñổi CSDL Để ñơn giản cho giải thuật khai phá luật kết hợp xây dựng giải thuật cho phép chuyển ñổi từ CSDL dạng quan hệ truyền thống sang CSDL giao dịch ñể trợ giúp luật kết hợp 2.3.5 Một số hướng tiếp cận khai phá luật kết hợp Lĩnh vực khai thác luật kết hợp cho ñến ñã ñược nghiên cứu phát triển theo nhiều hướng khác nhau: luật kết hợp nhị phân hướng nghiên cứu ñầu tiên luật kết hợp, luật kết hợp có thuộc tính số thuộc tính hạng mục, luật kết hợp tiếp cận theo hướng tập thô, luật kết hợp nhiều mức, luật kết hợp mờ, luật kết hợp với thuộc tính đánh trọng số, luật kết hợp song song Bên cạnh nghiên cứu biến thể luật kết hợp, nhà nghiên cứu cịn trọng đề xuất thuật tốn nhằm tăng tốc trình tìm kiếm tập phổ biến từ CSDL 2.3.6 Bài toán luật kết hợp Khái niệm: Cho tập I = {I1, I2, , Im} tập m mục, giao dịch T ñược ñịnh nghĩa tập khoản mục I (T⊆I) Gọi D CSDL n giao dịch giao dịch ñược ñánh nhãn với ñịnh danh Một giao dịch T ∈ D hỗ trợ tập X ⊆ I chứa tất item X Bài tốn 1: Tìm tất tập mục mà có độ hỗ trợ lớn ñộ hỗ trợ tối thiểu người dùng xác ñịnh Các tập mục thoả mãn ñộ hỗ trợ tối thiểu ñược gọi tập mục phổ biến Bài toán 2: Dùng tập mục phổ biến ñể sinh luật mong muốn Ý tưởng chung gọi ABCD AB tập mục phổ biến, xác định luật AB 2.3.7 Quy trình khai thác luật kết hợp Bước một: Tìm tất tập phổ biến ( theo ngưỡng minsup) Bước hai: Tạo luật từ tập phổ biến Đối với tập phổ biến S, tạo tất tập khác rỗng S Đối với tập khác rỗng A S luật A => (S - A) LKH cần tìm nếu: conf (A => (S - A)) = supp(S) / supp(A) ≥ minconf 2.3.8 Một số tính chất liên quan ñến hạng mục phổ biến: Với tập mục phổ biến, có tính chất sau: Tính chất (Độ hỗ trợ tập con): Với A B tập mục, A ⊆ B sup(A) ≥ sup(B) Điều rõ ràng tất giao tác D hỗ trợ B hỗ trợ A Tính chất 2: Một tập chứa tập khơng phổ biến tập khơng phổ biến Nếu mục B khơng có độ hỗ trợ tối thiểu D nghĩa sup(B)< minsup tập A B tập phổ biến support(B) ≤ support(A) < minsup (theo tính chất 1) Tính chất 3: Các tập tập phổ biến tập phổ biến Nếu mục B mục phổ biến D, nghĩa support(B) ≥ minsup tập A B tập phổ biến D support(A) ≥ support(B) > minsup 2.3.9 Phát luật kết hợp hệ thông tin nhị phân Độ hỗ trợ vectơ báo nhị phân Cho X1⊂ D, ñộ hỗ trợ vB(X1) biểu diễn supB(vB(X1)) ñược ñịnh nghĩa: supB(vB(X1)) = {o ⊂ O| ∀d ∈ X1, χ(o, d) = 1} Dễ thấy rằng: card(supB(vB(X1))) = card(ρB(X1)) Tính card(ρB(S)) (lực lượng tập hợp): Cho S = {s1, s2, … , sk} tập D Trong sj báo SB, j = ÷ k Mỗi sj tương ứng với vectơ báo nhị phân vB({sj}) Các yếu tố ρB(S) tính bằng: card(ρB(S)) = card(supB(vB{s1}) Θ supB(vB{sk})) 2.4 THUẬT TOÁN SINH LUẬT KẾT HỢP 2.4.1 Thuật tốn AIS Thuật tốn Agrwal đề nghị năm 1993 Thuật toán trọng khai phá luật kết hợp có dạng X Y, với Y tập hợp bao gồm tính chất (tập hợp phần tử) Thuật tốn tìm cách xây dựng tập ứng cử viên cho tập mục phổ biến Với cách đánh số thứ tự từ điển cho tính chất, việc bổ sung phần tử cho tập ứng cử viên tránh ñược trùng lặp, tiết kiệm tối đa thời gian tính tốn 2.4.2 Thuật tốn SETM Thuật tốn Houtsma đề nghị năm 1995 Thuật tốn sử dụng kỹ thuật bổ sung phần tử (từ tập hợp phần tử) nhằm tìm kiếm tập hợp ứng cử viên Một cải tiến ñáng kể Thuật toán ñề nghị lưu lại ID giao dịch với tập hợp ứng cử viên Agrawal ra, Thuật tốn khơng khơng có phương án quản lý nhớ mà cịn giả định nhét tồn tập hợp ứng cử viên bước trước vào nhớ ñể bước sau tiện bề sử dụng 2.4.3 Thuật toán Apriori-Tid Thuật toán ñược tỉa bớt tập ứng cử viên có tập khơng phổ biến trước tính độ hỗ trợ Thuật tốn Apriori tính tất tập ứng cử tập k lần duyệt CSDL Apriori dựa vào cấu trúc băm Tìm kiếm xuống cấu trúc ta chạm lá, ta tìm ñược tập ứng cử viên có tiền tố chung ñược bao gồm giao dịch Sau ñó tập ứng cử tìm giao dịch ánh xạ trước Trong trường hợp tìm thấy biến ñếm ñược tăng lên 2.4.4 Thuật toán Apriori mở rộng ñể sinh luật kết hợp Sau tập mục phổ biến từ tác vụ CSDL tìm thấy, sinh luật kết hợp mạnh, luật kết hợp mạnh (strong association rule) luật thoả mãn hai ñộ hỗ trợ cực tiểu ñộ tin cậy cực tiểu Điều thực việc sử dụng tính độ tin cậy luật, ta nhắc lại: độ tin cậy luật X → Y là: conf (X → Y) = P(Y/X) = sup(X∪Y)/sup(X), sup(X∪Y) ñộ hỗ trợ X∪Y sup(X) ñộ hỗ trợ X Có thể coi tỷ số tỷ số giữa: số tác vụ chứa X∪Y số tác vụ chứa X Dựa biểu thức tính tốn đó, luật kết hợp sinh sau: với tập mục phổ biến l, sinh tất tập không rỗng l, với tập không rỗng a l, ta có luật a → (l-a) Nếu sup(l ) ≥ minconf minconf ngưỡng độ tin cậy cực tiểu sup(a) Vì luật sinh từ tập mục phổ biến nên ñộ hỗ trợ luật ñã ñược thoả mãn, tức ñộ hỗ trợ luật sup(l) CHƯƠNG : XÂY DỰNG HỆ THỐNG TRỢ GIÚP PHÂN TÍCH HOẠT ĐỘNG ĐẦU TƯ 3.1 PHÁT BIỂU BÀI TOÁN Với số lượng giao dịch hàng ngày tăng, bình quân 80,650,490 lượt/ ngày CSDL giao dịch ngày tăng Với ngày thay ñổi, loại cổ phiếu tăng thêm dòng CSDL, ngồi thơng tin khác tăng thêm dịng/1 ngày Lượng CSDL lần phân tích chia theo khoảng thời gian (1 tuần, tháng, tháng, tháng, 12 tháng, 24 tháng, 36 tháng) Tất CSDL hồn tồn truy xuất Các liệu thu thập phân tích, định dạng chứa data warehouse, loại liệu ñược sử dụng ñể khai phá Sau giai ñoạn khai phá, ta sử dụng thuật tốn Apriori để đưa mẫu phân tích dùng cho dự đốn Các liệu dự đốn bao gồm số cố phiếu ngày kết tiếp (ngày T+1, T+2 T+3), khả mua/bán/chuyển nhượng (gọi chung giao dịch) hàng ngày, dự đốn khả diễn cổ phiếu Phân tích chương trình Giai ñoạn tiền xử lý: Giai ñoạn nhằm thiết lập ñối tượng liệu từ liệu CSDL Dữ liệu ñược tiền xử lý ñưa dạng text, thuộc tính (chính item) ánh xạ số tự nhiên (tức ñánh số thứ tự thuộc tính từ đến hết) Mỗi dịng (bản ghi) mơ tả thành dịng Tìm tập mục phổ biến luật kết hợp dựa số thứ tự này, kết ñược ánh xạ ngược trở lại tên mục ... nhà đầu tư phân tích hoạt động đầu tư phù hợp TTCK MỤC TIÊU NGHIÊN CỨU Xuất phát từ lý tơi thực đề tài: "Ứng dụng khai phá liệu xây dựng hệ thống phân tích hoạt ñộng ñầu tư thị trường chứng khoán? ??... dịch, rủi ro từ chấn động thị trường 1.2 TÌM HIỂU PHƯƠNG PHÁP VÀ MƠ HÌNH PHÂN TÍCH HOẠT ĐỘNG ĐẦU TƯ 1.2.1 Tìm hiểu phương pháp phân tích hoạt động đầu tư Các phương pháp phân tích chủ yếu dựa vào... 1.4.2 Khả phân tích hoạt động đầu tư TTCK Khả tư vấn TTCK theo học thuyết khó theo EMH 1.4.3 Phương thức phân tích hoạt động đầu tư Chúng ta phân loại kỹ thuật sau: phương pháp phân tích kỹ thuật,

Ngày đăng: 31/12/2013, 10:11

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan