khai phá dữ liệu phát hiện gian lận trong bảo hiểm y tế

27 606 2
khai phá dữ liệu phát hiện gian lận trong bảo hiểm y tế

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG LÃ THÚY HÀ TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT 2 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG LÃ THÚY HÀ ĐỀ TÀI KHAI PHÁ DỮ LIỆU PHÁT HIỆN GIAN LẬN TRONG BẢO HIỂM Y TẾ CHUYÊN NGÀNH :TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH MÃ SỐ: 60.48.15 8 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN DUY PHƯƠNG HÀ NỘI, 2012 3 Luận văn được hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: Tiến sỹ Nguyễn Duy Phương Phản biện 1: …………………………………………………… Phản biện 2: …………………………………………… …… Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc: giờ ngày tháng năm Có thể tìm hiểu luận văn tại: - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 4 MỞ ĐẦU Bảo hiểm xã hội trong đó có Bảo hiểm y tế là một chính sách lớn của Đảng và Nhà nước với mục tiêu lớn là an sinh xã hội, đảm bảo sự ổn định xã hội, hỗ trợ chi trả chi phí khám chữa bệnh hoặc một phần chi phí đó cho người dân. Trong chăm sóc sức khỏe y tế hiện nay, lạm dụng và gian lận y tế ngày một gia tăng đó không chỉ là gánh nặng cho xã hội, các tổ chức y tế mà cả người dân tham gia BHYT, những người phải chi trả một phần chi đó. Do đó phát hiện gian lận y tế bây giờ trở nên càng quan trọng. Việc phát hiện gian lận trong y tế nói chung và trong bảo hiểm y tế nói riêng là chủ đề quan tâm nghiên cứu và là đòi h ỏi cấp bách hiện nay. Phát hiện gian lận được hiểu là xác định gian lận một cách nhanh nhất khi nó xảy ra. Hiện nay không có phương pháp phát hiện gian lận nào thật sự hoàn hảo bởi vì các kỹ thuật gian lận luôn 5 thay đổi, phát sinh hình thức gian lận mới ngay khi một phương pháp phát hiện gian lận được biết đến và sử dụng. Một trong những yêu cầu khai phá dữ liệu được lựa chọn nhiều nhất là để phát hiện lạm dụng và gian lận trong nhiều lĩnh v ực khác nhau như tài chính ngân hàng, bảo hiểm ô tô, viễn thông, chứng khoán và bảo hiểm y tế. Từ những lý do trên và xu hư ớng tất yếu, Luận văn chọn đề tài: “Khai phá dữ liệu phát hiện gian lận trong bảo hiểm y tế”. Mục tiêu luận văn: Tìm hiểu vấn đề gian lận trong y tế (bảo hiểm y tế), các loại gian lận, các phương pháp phát hiện gian lận và đi sâu vào nghiên cứu phương pháp sử dụng kỹ thuật khai phá dữ liệu để phát hiện các hành vi gian lận một cách tự động dựa trên dấu hiệu bất thường so với dữ liệu trong quá khứ. Đối tượng nghiên cứu: - Các loại gian lận và một số phương pháp phát hiện gian lận - Kỹ thuật khai phá dữ liệu 6 - Nghiên cứu bài toán cụ thể với quản lý chi phí khám chữa bệnh tại cơ sở y tế và kỹ thuật khai phá dữ liệu trên tổng chi phí của từng bệnh nhân sử dụng phương pháp cây quyết định. Phương pháp nghiên cứu: - Nghiên cứu thực tiễn công tác quản lý chi phí khám chữa bệnh tại các cơ sở y tế - Nghiên cứu các tài liệu, báo cáo trong nước và nước ngoài có liên quan sử dụng kỹ thuật khai phá dữ liệu để phát hiện gian lận trong lĩnh vực y tế. - Tiến hành cài đặt và thử nghiệm. 7 CHƯƠNG I: TỔNG QUAN VỀ GIAN LẬN BẢO HIỂM Y TẾ 1.1 Giới thiệu chung về bảo hiểm y tế tại Việt Nam. Theo Luật Bảo hiểm y tế, Chính phủ thống nhất quản lý nhà nư ớc về bảo hiểm y tế. Trong đó trách nhiệm của các Bộ ngành liên quan gồm: Bộ Y tế được giao quản lý nhà nước, thực hiện các chính sách về lĩnh vực y tế, Bộ Tài chính phối hợp với Bộ Y tế, xây dựng chính sách, pháp luật về tài chính liên quan đến bảo hiểm y tế, thanh tra, kiểm tra việc thực hiện các quy định của pháp luật về chế độ tài chính đối với bảo hiểm y tế, quỹ bảo hiểm y tế Bảo hiểm y tế là hình thức bảo hiểm được áp dụng trong lĩnh vực chăm sóc sức khỏe, không vì mục đích lợi nhuận, do Nhà nước tổ chức thực hiện và các đối tượng tham gia với nguyên tắc: - Chia sẻ rủi ro giữa những người tham gia bảo hiểm y tế, - Mức hưởng bảo hiểm y tế theo mức độ bệnh tật, nhóm đối tượng trong phạm vi quyền lợi của người tham gia bảo hiểm y tế 8 - Chi phí khám bệnh, chữa bệnh bảo hiểm y tế do quỹ bảo hiểm y tế và người tham gia bảo hiểm y tế cùng chi trả. 1.1.1 Cơ cấu tổ chức quản lý bảo hiểm y tế của Bảo hiểm xã hội Việt Nam Bảo hiểm xã hội Việt Nam là cơ quan thuộc chính phủ thực thi các chính sách an sinh xã hội do Nhà nước ban hành trong đó có lĩnh v ực bảo hiểm y tế. Bảo hiểm xã hội Việt Nam cơ cấu ngành dọc từ Trung ương đến địa phương. Các bệnh viện thuộc tuyến Trung ương do Bảo hiểm xã hội Việt Nam quản lý, các cơ sở khám chữa bệnh tuyến tỉnh, thành phố trực thuộc Trung ương do tỉnh, thành phố quản lý. 1.1.2 Chức năng, nhiệm vụ của cơ quan Bảo hiểm xã hội trong y tế: a. Giám định bảo hiểm y tế. b. Thanh toán chi phí khám bệnh, chữa bệnh bảo hiểm y tế. 9 1.2 Hiện trạng gian lận trong bảo hiểm y tế Gian lận chăm sóc sức khỏe- trong lĩnh vực y tế là một lừa bịp cố ý hoặc làm sai lệch được thực hiện bởi một người hoặc một thực thể dẫn đến tổn thất về tài chính cho cơ sở khám chữa bệnh hoặc dọanh nghiệp tham gia trong lĩnh vực bảo hiểm y tế. Lạm dụng y tế được tạo ra khi một trong hai nhà cung cấp thực tiễn không phù hợp với mức tài chính chung, các dịch vụ, kinh doanh y tế đưa ra một chi phí không cần thiết hoặc trong bồi hoàn của các dịch vụ không cần hoặc các dịch vụ đó không đáp ứng các tiêu chuẩn chuyên nghiệp được công nhận trong chăm sóc sức khỏe. 1.2.2 Các hình thức gian lận bảo hiểm y tế Có nhiều hình thức gian lận và lạm dụng trong gian lận y tế. Dưới đây liệt kê những hình thức chủ yếu: a. Gian lận y tế từ các nhà cung cấp chăm sóc y tế, các cơ sở khám chữa bệnh, nhân viên y tế. b. Gian lận y tế nhà cung cấp trang thiết bị, thuốc điều trị. 10 c. Gian lận từ người tham gia thụ hưởng bảo hiểm: giả mạo giấy tờ, cho người khác mượn giấy tờ liên quan khi đi khám chữa bệnh. 1.2.3 Nguy cơ gian lận bảo hiểm y tế tại Việt Nam Tình trạng lạm dụng quỹ BHYT không chỉ xuất hiện ở Việt Nam mà ngay cả những nước có lịch sử phát triển BHYT trên 100 năm như Pháp, Đức cũng t ồn tại với nhiều hình thức khác nhau. Tuy nhiên, tại Việt Nam, tình trạng lạm dụng BHYT đang ngày càng nhiều với đủ các “tiểu xảo” từ nhiều đối tượng. Thực tế tình hình lạm dụng và gian lận bảo hiểm y tế ở Việt Nam hiện đang diễn ra hàng ngày tại các cơ sở KCB với những biểu hiện muôn hình vạn trạng từ đối tượng đến phương thức lạm dụng, hiện chưa có một công cụ hữu hiệu cũng như chính sách rõ ràng trong việc kiểm soát cũng như phát hiện gian lận. 1.3 Phòng chống và phát hiện gian lận trong y tế 1.3.1 Định nghĩa: Phòng chống gian lận là các biện pháp tránh gian lận, phát hiện gian lận ngay từ khi xuất hiện. [...]... PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÁT HIỆN GIAN LẬN 2.1 Phát hiện tri thức và khai phá dữ liệu là gì ? Phát hiện tri thức trong các cơ sở dữ liệu là một qui trình nhận biết các mẫu hoặc các mô hình trong dữ liệu với các tính năng: hợp thức, mới, khả ích, và có thể hiểu được Còn khai thác dữ liệu là một bước trong qui trình phát hiện tri thức gồm các thuật toán khai thác dữ liệu chuyên dùng... hiệu gian lận 26 KẾT LUẬN Luận văn đã đạt được một số kết quả chính như sau: - Nghiên cứu vấn đề gian lận trong ĩnh v ực bảo l hiểm y tế, các biện pháp phòng chống gian lận y tế; tìm hiểu tình hình phòng chống gian lận y tế trên thế giới áp dụng mô hình cho Việt Nam - Tìm hiểu các phương pháp phát hiện gian lận: Hiện nay có nhiều phương pháp phát hiện gian lận các kỹ thuật được sử dụng như: học m y, khai. .. học m y, khai phá dữ liệu, … hay các mô hình thông kê - Khai phá dữ liệu là một trong những kỹ thuật được áp dụng rộng rãi trên nhiều lĩnh v ực nói chung và trong phát hiện gian lận nói riêng - Luận văn đ ti ến hành cài đặt phương pháp c y ã quyết định và thuật toán C4.5 để pháp hiện gian lận trong lĩnh vực BHYT dựa trên việc khảo sát, đánh giá từ nguồn dữ liệu thực tế của Bệnh viện Đức Giang năm 2011... các dữ liệu 15 Bước thứ tư là hiểu tri thức đã tìm được, đặc biệt là làm sáng tỏ các mô tả và dự đoán 2.3 Quá trình khai phá dữ liệu Khai phá dữ liệu là một tập hợp các kỹ thuật được sử dụng để tự động khai thác và tìm ra các mối quan hệ lẫn nhau của dữ liệu trong một tập hợp dữ liệu khổng lồ và phức tạp, đồng thời cũng tìm ra các mẫu tiềm ẩn trong tập dữ liệu đó 2.4 Các phương pháp khai phá dữ liệu. .. tức vùng ngực 27 HƯỚNG NGHIÊN CỨU TIẾP THEO Triển khai, áp dụng phương pháp phát hiện gian lận đã đư ợc nghiên cứu kể trên vào thực tế tại cơ quan Bảo hiểm xã hội, góp phần phát hiện, giảm thiểu các trường hợp gian lận, lạm dụng quỹ BHXH đảm bảo quyền lợi của người dân tham gia BHYT khi đi khám chữa bệnh X y dựng và mở rộng phạm vi phát hiện gian lận quỹ BHXH không chỉ trên một mã bệnh mà áp dụng...11 Phát hiện gian lận là xác định gian lận nhanh nhất có thể khi đã x y ra 1.3.2 Tình hình phòng ống và phát hiện gian lận ch trong lĩnh vực y tế: Theo kiểm toán của Liên bang Mỹ thì thật khó có thể xác định một hành động có là lạm dụng hay không khi các biến thể trong thanh toán thực tế, không thể tự động nhận dạng như lạm dụng thanh toán hoặc chăm sóc y tế được xem là không thích hợp Dịch vụ y tế. .. di truyền Thuật toán di truyền dựa trên một ẩn dụ sinh học áp dụng quy luật chọn lọc tự nhiên Thuật toán di truyền gồm có bốn quy luật cơ bản là lai ghép, đột biến, sinh sản và chọn lọc tự nhiên 17 CHƯƠNG III : KHAI PHÁ DỮ LIỆU BẰNG C Y QUYẾT ĐỊNH 3.1 Một số khái niệm cơ bản về c y quyết định: C y quyết định là một cấu trúc ra quyết định có dạng c y C y quyết định là một trong phương pháp học m y tiêu... m y Có hai hướng giải pháp chính để hạn chế quá vừa dữ liệu cho c y quyết định: - Dừng c y quyết định sớm trước khi c y đủ phức tạp để phân loại đúng mẫu huấn luyện - X y dựng c y đ y đủ, sau đó cắt tỉa để có c y đơn giản Phương pháp n y được sử dụng trên thực tế 3.4.1.3 Cơ chế riêng trong xử lý những giá trị thiếu Giá trị thiếu của thuộc tính là hiện tượng phổ biến trong dữ liệu, có thể do lỗi khi... tìm ra các mẫu hoặc các mô hình trong dữ liệu 2.2 Quá trình phát hiện tri thức từ cơ sở dữ liệu Bước thứ nhất là tìm hiểu lĩnh v ực ứng dụng và hình thành bài toán Bước thứ hai là thu thập và xử lý thô, còn được gọi là tiền xử lý dữ liệu nhằm loại bỏ nhiễu, xử lý việc thiếu dữ liệu, biến đổi dữ liệu và rút gọn dữ liệu nếu cần thiết Bước thứ ba là khai phá dữ liệu, hay nói cách khác là trích ra các... x y dựng c y quyết định và tạo xong tập luật Chương 25 trình sẽ thống kê số lượng các bản ghi nghi ngờ có khả năng gian lận và đưa ra các bản ghi đó 4.3.2 Dữ liệu thử nghiệm: Tập dữ liệu thử nghiệm là tập dữ liệu nhỏ với 236 bản ghi được l y từ kho dữ liệu Dữ liệu thử nghiệm được trích chọn trên cùng một mã bệnh và được xử lý phù hợp với dữ liệu tập huấn luyện như tên các trường và thuộc tính của dữ . cũng như phát hiện gian lận. 1.3 Phòng chống và phát hiện gian lận trong y tế 1.3.1 Định nghĩa: Phòng chống gian lận là các biện pháp tránh gian lận, phát hiện gian lận ngay từ khi xuất hiện. . trong y tế (bảo hiểm y tế) , các loại gian lận, các phương pháp phát hiện gian lận và đi sâu vào nghiên cứu phương pháp sử dụng kỹ thuật khai phá dữ liệu để phát hiện các hành vi gian lận một. CHƯƠNG II. CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÁT HIỆN GIAN LẬN 2.1. Phát hiện tri thức và khai phá dữ liệu là gì ? Phát hiện tri thức trong các cơ sở dữ liệu là một qui trình

Ngày đăng: 20/12/2014, 11:46

Từ khóa liên quan

Mục lục

  • Luận văn được hoàn thành tại:

  • HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

  • Người hướng dẫn khoa học: Tiến sỹ Nguyễn Duy Phương

  • Phản biện 1: ……………………………………………………

  • Phản biện 2: ……………………………………………..……

  • Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông

  • Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............

  • Có thể tìm hiểu luận văn tại:

    • Giới thiệu chung về bảo hiểm y tế tại Việt Nam.

    • 1.2 Hiện trạng gian lận trong bảo hiểm y tế

      • 1.2.2 Các hình thức gian lận bảo hiểm y tế

      • 1.2.3 Nguy cơ gian lận bảo hiểm y tế tại Việt Nam

      • 1.3 Phòng chống và phát hiện gian lận trong y tế

        • 1.3.1 Định nghĩa:

        • 1.3.2 Tình hình phòng chống và phát hiện gian lận trong lĩnh vực y tế:

        • 1.3.3 Các phương pháp phòng chống gian lận trong lĩnh vực y tế

        • 2.1. Phát hiện tri thức và khai phá dữ liệu là gì ?

        • 2.2. Quá trình phát hiện tri thức từ cơ sở dữ liệu

        • 2.3 Quá trình khai phá dữ liệu

        • 2.4. Các phương pháp khai phá dữ liệu

          • 2.4.1 Phương pháp suy diễn và quy nạp

          • 2.4.2 Phân nhóm và phân đoạn

          • 4.3 Cây quyết định

          • 2.4.5 Mạng Neural

Tài liệu cùng người dùng

Tài liệu liên quan