Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM Phần 2: Phát hiện sai lệch với InfoSphere Warehouse và Cognos pptx

19 352 0
Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM Phần 2: Phát hiện sai lệch với InfoSphere Warehouse và Cognos pptx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tích hợp khai phá liệu InfoSphere Warehouse với việc tạo báo cáo Cognos IBM Phần 2: Phát sai lệch với InfoSphere Warehouse Cognos Mở đầu Phát hành vi đáng ngờ lúc nhiệm vụ quan trọng nhiều ứng dụng CNTT Ví dụ, tưởng tượng giao dịch thẻ tín dụng Nếu người dùng cho thấy có hành vi mua sắm cao bất thường (ví dụ, mua sắm cửa hàng giảm giá thường xuyên sau mua đồ trang sức đắt tiền), thật tốt để kiểm tra giao dịch tương ứng có dấu hiệu gian lận Tuy nhiên, sử dụng sai lệch nhiều tình khác để phát gian lận giả mạo Các quan nguồn nhân lực sử dụng việc phát sai lệch để tìm nhân viên ứng cử viên không phù hợp với phạm trù thơng thường bỏ qua áp dụng quy tắc cố định để xác định tiềm cao Các ghi liệu lệch khỏi toàn phân bố ghi liệu gọi ngoại lệ Việc xử lý ngoại lệ thường khơng phải nhiệm vụ hồn tồn tự động hóa Đúng là, sử dụng việc khai phá liệu để ghi liệu đáng xem xét kỹ nhà phân tích chuyên gia người, người sau phải định xem có hành động hay khơng Vì thế, giao diện người dùng mơ hình tương tác tinh vi điều kiện tiên để xử lý thành công ngoại lệ Cognos thích hợp cho cơng việc Trên thực tế, ghi tương tự ghi tạo viết loạt sử dụng để hiển thị trực quan ngoại lệ Hãy tận dụng toàn tiềm Cognos để hiển thị ngoại lệ, nhiên, bạn cần sử dụng số tính cao cấp Trước tiên, xem cách sử dụng "truy vấn ngược-drill-through" (ND: drill-through tính cho phép người dùng từ báo cáo tổng hợp tìm ngược tận ghi liệu gốc Sau gọi truy vấn ngược) để tạo báo cáo Cognos tương tác cách liên kết ghi Điều giúp tóm tắt thơng tin dành chỗ để truy cập nhanh đến ghi liệu ngoại lệ có liên quan Thứ hai, tìm hiểu cách trích xuất thơng tin bổ xung từ mơ hình khai phá liệu giúp chuyên gia người hiểu chất ngoại lệ Ví dụ chạy viết ứng dụng giúp nhân viên ngân hàng nhận biết khách hàng tỏ có hành vi bất thường Có thể sử dụng việc để tránh gian lận để phát khách hàng đáng quan tâm đặc biệt Trong phần sau, trình bày tổng quan phát sai lệch xem cách sử dụng InfoSphere Warehouse để tìm ngoại lệ tập liệu lớn Các phần trình bày vấn đề truy vấn ngược (drill-through) trích xuất thơng tin từ mơ hình khai phá liệu cho thấy cách sử dụng để hai kỹ thuật để tạo kết phát sai lệch dễ hiểu dễ sử dụng Về đầu trang Phát sai lệch với InfoSphere Warehouse Phát sai lệch gì? Phát sai lệch định nghĩa nhiệm vụ tìm ghi liệu bất thường tập liệu lớn Các ghi gọi ghi ngoại lệ Làm để định nghĩa xác "bất thường" chủ đề tranh luận học thuật phụ thuộc vào lĩnh vực áp dụng phát sai lệch Ở mức chung, phát sai lệch nhằm để tìm ghi liệu có đặc tính khơng tn theo phân bố thống kê đa số ghi liệu Tùy thuộc vào lĩnh vực ứng dụng, sai lệch là: Dữ liệu khơng (ví dụ, người có tuổi 300, có lẽ nhập khơng vào sở liệu) Hành vi bất thường trình phía (ví dụ, giao dịch thẻ tín dụng khơng thực theo quy trình thơng thường) Do đó, sử dụng việc phát sai lệch cho nhiệm vụ khác Nếu bạn giả định liệu bạn có chứa liệu khơng đúng, bạn áp dụng việc phát sai lệch để làm liệu, tìm kiếm mục nhập khơng sở liệu bạn Trong trường hợp thứ hai, liệu đúng, cho biết số quy trình phản ánh liệu cho thấy có hành vi bất thường Cùng với việc làm liệu, ứng dụng phát sai lệch thứ hai sử dụng để phát gian lận Như trên, hành vi bất thường khơng thiết gian lận Ví dụ, cho biết q trình lên, tức "các khách hàng cao tuổi thực nhiều đấu giá trực tuyến" Việc phát từ sớm các trình lên vậy, cho phép công ty cung cấp sớm sản phẩm hay dịch vụ mới, tạo cho họ lợi quan trọng so với đối thủ cạnh tranh Một ứng dụng tương tự có lĩnh vực tài Việc phát sai lệch sử dụng để tìm khoản đầu tư đầy hứa hẹn không phù hợp với q trình thơng thường chưa công nhận Trong trường hợp, nhà phân tích người phải kiểm tra các ghi ngoại lệ để xem liệu giá trị số liệu khơng hay khơng liệu có phải thực số hành động để tránh gian lận để tận dụng số hội chưa công nhận không Trong phần sau, tìm hiểu cách InfoSphere Warehouse phát ngoại lệ cách bạn áp dụng việc phát sai lệch cho liệu bạn Phần lại viết thảo luận cách hiển thị trực quan ngoại lệ tương tác Cognos Phát sai lệch InfoSphere Warehouse Trong năm gần đây, người ta đề xuất nhiều phương pháp khác để phát sai lệch InfoSphere Warehouse sử dụng phương pháp đặc biệt mạnh mẽ dùng để phát sai lệch dựa phân cụm liệu Phân cụm biểu thị kỹ thuật khai phá liệu để phân nhóm ghi liệu thành cụm (cluster) có cặp ghi giống theo đặc tính chúng Chúng ta xem Hình Mỗi điểm biểu đồ đại diện cho khách hàng Trong trường hợp đơn giản này, khách hàng mô tả theo độ tuổi số dư trung bình InfoSphere Warehouse sử dụng thuật tốn phân cụm thống kê để phân nhóm khách hàng giống theo hai chiều thành thành cụm Như bạn thấy, có số cụm lớn tập trung nhiều cụm khác (Cluster trái với Cluster 3) InfoSphere Warehouse kết hợp số đặc tính để gán cho cụm mức "độ lệch" Nếu mức độ lệch cao hơn, nhiều khả ghi cụm coi ngoại lệ Hình Phát sai lệch phân cụm Vì vậy, khơng có phân biệt rõ ràng ngoại lệ khơng ngoại lệ Do đó, người sử dụng phải xác định ngưỡng cho ngoại lệ Tất cụm có mức ngoại lệ ngưỡng đánh dấu cụm ngoại lệ tất thành viên chúng ngoại lệ Ngưỡng thiết lập theo hai cách Thứ nhất, bạn có số lượng hạn chế chuyên gia có khả kiểm tra ngoại lệ, bạn cần sử dụng ghi liệu thuộc cụm có mức độ lệch cao Nếu bạn tìm kiếm cơng ty hứa hẹn để đầu tư, bạn bắt đầu với cụm có mức độ lệch cao sau hạ dần mức bạn xuống, miễn bạn có nguồn lực Thứ hai, cố định ngưỡng Đây trường hợp kịch cảnh báo yêu cầu thực hành động có ghi liệu gán cho cụm có mức độ lệch ngưỡng cụ thể InfoSphere Warehouse cho phép bạn thực hai cách cách cần gán mã định danh cụm (id cluster) mức độ lệch tương ứng cho ghi liệu Bạn lọc ghi xếp chúng để có ngoại lệ mà bạn muốn xem lại bạn phải kiểm tra Phần sau cung cấp ví dụ bước cách tìm ngoại lệ InfoSphere Warehouse cách gán mức độ lệch cho ghi liệu riêng rẽ Một ví dụ thực tế Trong ví dụ sau đây, việc phát sai lệch áp dụng cho mục nhập khách hàng ngân hàng Dữ liệu mẫu bảng tương ứng Hình Bảng BANK.BANKCUSTOMERS kèm với mẫu InfoSphere Warehouse Hình Dữ liệu mẫu bảng BANK.BANKCUSTOMERS Để phát ngoại lệ viết này: Tạo luồng khai phá mới, thấy viết trước Ngoài ra, thấy viết trước, bạn phải kéo tốn tử nguồn bảng vào trình soạn thảo Nhấn đúp vào toán tử để mở nó, rõ BANK.BANKCUSTOMERS làm bảng sở liệu nguồn nhấn OK để xác nhận Bây giờ, kéo tốn tử "Find Deviations" (Các sai lệch tìm thấy) vào vùng bên cạnh nguồn bảng nối chân đầu nguồn bảng với chân đầu vào "Find deviations" Thay đổi tên mơ hình mơ hình cụm toán tử "Find deviations" tạo thành IDMMX.OUTLIERMODEL Nhấn đúp vào tốn tử để mở đặc tính thay đổi tên mơ hình trang trình thủ thuật thứ hai Cuối cùng, tạo bảng đích phù hợp cách chọn "Create Suitable Table " (Tạo bảng thích hợp ) từ trình đơn ngữ cảnh nhấn chuột phải cổng đầu toán tử "Find Deviations" Trên trang trình thủ thuật đầu tiên, chọn lược đồ BANK (Ngân hàng) nhập tên bảng CUSTOMERS_OL Nhấn chuột vào Finish (Kết thúc) Một toán tử "Table Target" (Đích bảng) nối tới luồng Nếu bạn muốn chạy luồng nhiều lần, nên đánh dấu chọn hộp kiểm tra "Delete Previous Content" (Xóa nội dung trước) đặc tính toán tử "Table Target" Luồng cần nạp bảng khách hàng, chuyển tới thuật tốn phát sai lệch viết kết vào bảng (xem Hình 3) Có thể thấy trích xuất kết Hình Hình Sử dụng luồng khai phá để phát sai lệch Như bạn thấy, có hai cột bổ sung, cụ thể cột DEV_DEGREE cột CLUSTER_ID Cột Mức độ lệch rõ làm để coi ghi ngoại lệ Cột mã định danh cụm mã định danh cụm "ngoại lệ" có ghi thuộc Có thể trích xuất thơng tin bổ sung cụm nhờ phân tích mơ hình cụm tốn tử sai lệch tìm thấy tạo bên (Bài viết thảo luận điều sau) Hình Dữ liệu mẫu từ bảng kết quả, BANK.CUSTOMER_OL Về đầu trang Tạo báo cáo Cognos tương tác để phát sai lệch Trong phần này, tìm hiểu cách để tạo báo cáo Cognos cho phép bạn kiểm tra ngoại lệ theo cách tương tác Đầu tiên, bạn sử dụng báo cáo tương tự viết loạt Thay cho bảng bệnh nhân với báo cho biết số họ đề xuất khám sức khỏe, bạn có danh sách khách hàng với báo cho biết khách hàng cần kiểm tra hành động gian lận khả nghi Trong cách tiếp cận hoạt động tốt với lượng khách hàng nhỏ hơn, nên danh sách có hàng ngàn mục nhập khơng thuận tiện Ngồi ra, nhà phân tích muốn xem làm cho khách hàng cụ thể trở thành "ngoại lệ" Bạn cần số thông tin bổ sung để đưa lời giải thích Vì thế, mở rộng phương pháp đơn giản theo hai cách:   Nhóm khách hàng theo nghề đưa tổng quan có ngoại lệ có theo thể loại nghề Việc dùng loại phân nhóm cách hay để đối phó với số lượng lớn thơng tin Ví dụ, người ta cho thể loại xem xét phân tích nhân viên cụ thể chịu trách nhiệm thể loại Thay theo nghề nghiệp, có khả theo lĩnh vực khác (chẳng hạn theo vị trí) Làm giàu cho ghi ngoại lệ thông tin lý coi ghi cụ thể ngoại lệ Như nói trên, ghi gán cho cụm tất thành viên cụm chia sẻ mức độ lệch Bạn sử dụng đặc tính cụm để mơ tả ngoại lệ Ví dụ, cụm chứa hầu hết người trẻ có số dư trung bình cao điều lời giải thích tốt lý cụm xác định ngoại lệ Phần sau trước tiên cho thấy cách làm giàu ngoại lệ thơng tin bổ sung Sau đó, bạn tạo ghi tương tác để phân nhóm khách hàng theo nghề họ cho phép bạn chọn ngoại lệ cách tương tác theo thể loại cụ thể cách sử dụng tính "truy vấn ngược" (drill-through) Cognos Trích xuất thơng tin bổ sung từ mơ hình khai phá liệu Bảng CUSTOMER_OL chứa thơng tin có liên quan ngoại lệ Như nói trên, ghi gán cho cụm Toán tử "Find Deviations" tạo mơ hình cụm tảng lưu trữ thông tin chi tiết cụm Thông tin lưu trữ theo định dạng PMML (Predictive Model Markup Language-Ngơn ngữ đánh dấu mơ hình dự báo) sở liệu Nó chứa thơng tin về:      Sự phân bố giá trị cụm Số lượng ghi cụm Tầm quan trọng biến cho cụm Tính đồng cụm Nhiều thơng tin Bạn sử dụng thủ tục lưu sẵn có InfoSphere Warehouse để trích xuất thơng tin vào kết sử dụng Cognos Các tập kết coi "các khung nhìn" khơng tạo rõ ràng sở liệu tạo lúc chạy thủ tục lưu sẵn Nếu bạn muốn trích xuất thơng tin nguyên văn cụm, bạn sử dụng lệnh sau đây: SELECT ID, DESCRIPTION FROM TABLE(IDMMX.DM_GETCLUSTERS((SELECT MODEL FROM IDMMX.CLUSTERMODELS WHERE MODELNAME='IDMMX.OUTLIERMODEL'))) AS CT Lệnh cung cấp cho bạn bảng chứa cột sau:   ID: mã định danh cụm (tương ứng với ID bảng CUSTOMER_OL) DESCRIPTION (Mô tả): Mô tả nguyên văn cụm Các tập kết Cognos sử dụng khung nhìn bảng quy Điều bạn phải nhận biết thủ tục lưu trữ khơng bao gồm DB2 mà cịn InfoSphere Warehouse thêm vào Hãy quay lại phần sau lát Hình tóm tắt hai cách lấy thông tin từ InfoSphere đến Cognos: theo khung nhìn/các bảng sở liệu đơn giản theo trích xuất từ mơ hình khai phá sử dụng thủ tục lưu trữ Các thủ tục lưu trữ không tồn với mơ hình cụm mà cịn với nhiều mơ hình khai phá khác Với danh sách đầy đủ hàm trích xuất mơ hình có sẵn, xem tài liệu InfoSphere Warehouse (xem phần Tài nguyên) Trong phần sau đây, chúng tơi cho bạn thấy sử dụng Nhà quản lý khung công tác Cognos (Cognos framework manager) để kết hợp hai loại thông tin Hình Hai cách truy cập thơng tin liên quan đến khai phá Cognos Nhập kết hợp kết khai phá Cognos Framework Manager Với báo cáo mình, bạn cần hai chủ thể truy vấn dự án Cognos mà sau bạn nối vào để có mơ tả nguyên văn cho ngoại lệ:   Một chủ thể truy vấn đơn giản truy cập vào bảng ngoại lệ BANK.CUSTOMER_OL tạo phần Chủ thể truy vấn chứa ghi khách hàng với mức độ lệch mã định danh cụm Một chủ thể truy vấn có sử dụng thủ tục lưu để truy cập thơng tin cụm mơ hình phân cụm thuật toán khai phá tạo Như mô tả trên, số thông tin khác, thông tin cụm chứa mô tả văn ngắn cụm (trong trường hợp này, mơ tả tất ghi ngoại lệ cụm này) Trước tiên, bạn phải tạo dự án Cognos Framework Manager kết nối đến sở liệu mẫu DWESAMP InfoSphere Warehouse có bảng BANK.CUSTOMERS_OL, tạo Trong viết loạt cung cấp hướng dẫn chi tiết cách đạt điều Đó cách làm tốt để tạo chủ thể truy vấn vùng tên PresentationView (Khung nhìn trình diễn) có chứa thơng tin bạn cần từ sở liệu để có tầng trừu tượng chủ thể truy vấn, tạo từ câu lệnh SQL Điều cho phép bạn thay đổi tên cột theo văn có tính mơ tả thêm cột bổ sung Bạn cần mục truy vấn cờ-ngoại lệ biết liệu ghi coi ngoại lệ chưa Hãy tính tốn điều từ mục truy vấn mức độ lệch DEV_DEGREE Để tạo chủ thể truy vấn bảng ngoại lệ báo cáo sử dụng: Tạo chủ thể truy vấn "OutlierTable" (Bảng ngoại lệ) vùng tên PresentationView từ mơ hình (các chủ thể truy vấn mục truy vấn có) Thêm tất mục truy vấn từ chủ thể truy vấn CUSTOMER_OL thay đổi tên cho nhãn có tính mô tả Thêm mục truy vấn với định nghĩa biểu thức sau đây: IF ([PresentationView].[OutlierTable].[Deviation factor] > 1000) then (1) else (0) Mục truy vấn "1" độ lệch cao 1000; khơng "0" Tham số độ lệch 1000 chọn làm tham số ngưỡng độ nhạy cho tập liệu Thật có ích để làm cho độ nhạy sai lệch tham số hóa để trả nhiều hay ghi ngoại lệ Định nghĩa chủ thể truy vấn bạn trơng giống Hình 6: Hình Định nghĩa chủ thể truy vấn bảng ngoại lệ Mục truy vấn thứ hai bảng có thơng tin cụm mơ hình phân cụm tạo trình chạy độ lệch tìm thấy Mơ tả dạng bảng mơ hình phân cụm trích xuất Khai phá liệu InfoSphere Warehouse hàm người sử dụng định nghĩa IDMMX.DM_GETCLUSTERS trả bảng cụm mơ hình với mơ tả văn ngắn phân bố trường cụm Các mô hình phân cụm lưu CLOBS bảng IDMMX.CLUSTERMODELS với cột "MODELNAME" dùng để chọn mơ hình Hàm người dùng định nghĩa cần bao bọc câu lệnh SELECT Cognos sử dụng Do hàm bảng Khai phá InfoSphere Warehouse hàm DB2 chuẩn, nên cần thay đổi số tùy chọn Cognos trước tạo chủ thể truy vấn Để tạo chủ thể truy vấn mô tả cụm từ hàm bảng DB2: Chọn sở liệu DWESAMP thư mục Data Sources (Các nguồn liệu) Project Viewer thay đổi đặc tính "Query Processing" (Xử lý truy vấn) khung nhìn đặc tính thành "Limited Locale" (Vị trí giới hạn) Điều cho phép chủ thể truy vấn từ SQL mà Cognos chưa biết Tạo chủ thể truy vấn "OutlierClusters" (Các cụm ngoại lệ) vùng tên PresentationView lựa chọn để mơ hình hóa chủ thể truy vấn từ nguồn liệu Việc mơ hình hóa từ thủ tục lưu hỗ trợ cho thủ tục lưu trữ mà Cognos biết Trên trang "Select a data source" (Chọn nguồn liệu), chọn DWESAMP xóa dấu chọn hộp kiểm tra Run database query subject wizard (Chạy trình thủ thuật chủ thể truy vấn sở liệu) Trình thủ thuật chủ thể truy vấn làm việc cho SQL chuẩn Nhấn Finish 4 Sau tạo chủ thể truy vấn, trình thủ thuật Query Subject Definition (Định nghĩa chủ thể truy vấn) mở Nhập mã SQL để trả cụm mơ hình đó, IDMMX.OUTLIERMODEL tên mơ hình phân cụm tạo trình chạy "các độ lệch tìm thấy" SELECT * FROM TABLE(IDMMX.DM_GETCLUSTERS((SELECT MODEL FROM IDMMX.CLUSTERMODELS WHERE MODELNAME='IDMMX.OUTLIERMODEL'))) AS CT Do lúc khơng có Cognos phù hợp với SQL, nên kiểu truy vấn SQL cần phải thiết lập tới "Native" (Nguyên gốc), để nói cho Cognos biết chuyển SQL tới sở liệu, thay giải thích Để thay đổi thiết lập này, mở thẻ "Query Information" (Truy vấn thông tin) đặc tính chủ thể truy vấn Chọn "Options" (Các tùy chọn) thay đổi "SQL type" thẻ "SQL settings" (Các giá trị cài đặt SQL) thành "Native" Việc chạy "Test Sample" (Kiểm tra mẫu) cần trả bảng có cụm mơ hình đó, cho thấy Hình 7: Hình Các kết kiểm tra chủ thể truy vấn cụm ngoại lệ Việc sử dụng thủ tục lưu trữ làm đầu vào chủ thể truy vấn có lợi không tạo bảng khung nhìn khơng cần thiết sở liệu Quan trọng hơn, thủ tục lưu trữ thực việc tạo báo cáo Điều làm cho có khả thực động tính tốn khai phá thời điểm tạo báo cáo Chủ thể trình bày nhiều viết tới loạt Để tạo ghi nối bảng chủ thể truy vấn OutlierTable (Bảng ngoại lệ) OutlierClusters (Các cụm ngoại lệ), bạn phải tạo mối quan hệ mã định danh cụm cho điểm ghi ngoại lệ mã định danh cụm bảng cụm Để tạo mối quan hệ chủ thể truy vấn OutlierTable OutlierClusters: Chọn Create Relationship (Tạo mối quan hệ) từ trình đơn ngữ cảnh OutlierTable Với chủ thể truy vấn bên trái, chọn mã định danh cụm OutlierTable thiết lập cardinality (số tham số tập) n có nhiều ghi thuộc cụm Với chủ thể truy vấn bên phải, thêm chủ thể truy vấn OutlierClusters, chọn cột ID thiết lập cardinality 1 có hàng cho cụm Chọn OK Hình Mối quan hệ chủ thể truy vấn OutlierTable OutlierClusters Bây bạn tạo chủ thể truy vấn cần thiết cho báo cáo Cognos triển khai "OutliersPackage" (Gói ngoại lệ) có chứa PresentationView dự án cho Cognos Content Store (Kho lưu trữ nội dung Cognos) Việc tạo triển khai gói đạt mô tả viết trước loạt Hình Các tài nguyên tạo Framework Manager Liên kết báo cáo Cognos truy vấn ngược (drill-through) Khái niệm ban đầu "drill-through" nói đến nhiệm vụ chuyển hướng từ giá trị tổng hợp đến ghi riêng biệt Đây nhiệm vụ phổ biến ứng dụng OLAP Trong Cognos, khái niệm dùng theo nghĩa rộng loại "liên kết" báo cáo với Như vậy, định nghĩa truy vấn ngược (drill-through) phù hợp với mục đích tương tự siêu liên kết HTML Liên kết báo cáo tự khơng phải tính mạnh mẽ Điều làm cho định nghĩa truy vấn ngược (drill-through) trở thành công cụ mạnh sử dụng tham số Ví dụ, báo cáo Cognos chứa tham số sử dụng để tạo truy vấn dễ tham số hóa Nếu tham số không thiết lập, người dùng nhắc nhở chúng Trong định nghĩa truy vấn ngược (drillthrough), tham số định nghĩa phần siêu liên kết (giống yêu cầu HTTP GET) Các giá trị cho tham số rút từ ngữ cảnh liên kết Phần sau đưa ví dụ minh họa cho khái niệm cách sử dụng hai báo cáo liên kết Tạo ghi ngoại lệ Cognos Report Studio (Công cụ tạo báo cáo Cognos) Trong phần này, tạo dự án có hai trang báo cáo dựa vào OutliersPackage triển khai:   Trang cho thấy tổng quan ghi khách hàng nhóm lại theo nghề với số lượng ngoại lệ tương ứng cho nghề Một trang báo cáo cho thấy báo cáo sai lệch thực với nghề định Cả hai báo cáo kết hợp cho có khả truy vấn ngược (drill-through) đến ghi sai lệch so với trang tổng quan Do trang tổng quan có liên kết đến trang chi tiết, nên tạo trước tiên Trang chi tiết ngoại lệ chứa ghi khách hàng gắn cờ ngoại lệ, thuộc nghề lựa chọn trang báo cáo Để tạo tương tác này, bạn cần phải thêm tham số cho nghề vào ghi sử dụng lọc ghi Bạn cần thêm điều kiện cho lọc để trả ghi có mục truy vấn Outlier Flag (Cờ truy vấn) "1" (tất ghi có mức độ lệch vượt ngưỡng) Để tạo trang báo cáo "Outlier Details" (Các thông tin chi tiết), làm sau: Tạo Report (báo cáo) Cognos Report Studio cách sử dụng OutliersPackage Thêm đối tượng danh sách vào báo cáo Thêm chủ thể truy vấn OutlierTable vào danh sách cách kéo từ khung nhìn "Insertable Objects" (Các đối tượng chèn vào) Thêm mục truy vấn DESCRIPTION (Mô tả) chủ thể truy vấn OutlierClusters vào danh sách Thêm lọc vào danh sách cách chọn danh sách nhấn vào biểu tượng "Filters" (Bộ lọc) công cụ từ trình đơn Data > Filters Trong trình thủ thuật, thêm "Details filter" (Bộ lọc thông tin chi tiết) với biểu tượng "Add" Trong trang "Detail Filter Expression" (Chi tiết biểu thức lọc), thêm mã sau vào "Expression Definition" (Định nghĩa biểu thức) ([PresentationView].[OutlierTable].[Outlier flag] = 1) AND ([PresentationView].[OutlierTable].[Profession] = ?Profession?) Cognos tự động phát từ khoá "Profession" (Nghề nghiệp) bao quanh dấu "?" tham số thêm vào danh sách tham số báo cáo Xác nhận lọc cách nhấn OK Hình 10 Bộ lọc cho trang Outlier Details 10 Thay đổi văn tiêu đề báo cáo tiêu đề cột theo ý thích bạn lưu báo cáo bạn OutlierDetails Hình 11 Cognos Report Studio với báo cáo Outlier Details Trang tổng quan có chứa danh sách tất nghề có số lượng ghi khách hàng số ngoại lệ cho nghề Số lượng ghi tính cách sử dụng hàm tổng hợp Cognos Để tạo trang OutlierOverview (Tổng quan ngoại lệ): Tạo báo cáo Cognos Report Studio cách sử dụng OutliersPackage Thêm đối tượng danh sách vào báo cáo Từ chủ thể truy vấn OutlierTable khung nhìn "Insertable Objects", kéo mục truy vấn: Profession (Nghề nghiệp), Customer ID (Mã định danh khách hàng) Outlier flag (Cờ ngoại lệ) vào danh sách Cột mã định danh Khách hàng sử dụng biết số lượng ghi khách hàng cho nghề Để tính tốn điều này, bạn cần phải thay đổi hàm tổng hợp cột tới "Count" (Đếm) khung nhìn đặc tính cột Cột OutlierFlag sử dụng biết số lượng ghi sai lệch cho nghề Do cột chứa "1" cho ghi sai lệch "0" cho ghi không sai lệch, bạn cần thêm giá trị cột Thay đổi hàm tổng hợp cột vào Total (Tổng số) Thay đổi đặc tính "Data Item" > "Name" "Data Item" > "Label" cột "Customer ID" "Outlier flag" thành Number of customersvà Number of outliers Để cho phép truy vấn ngược (drill-through) đến OutlierDetails Report (Báo cáo chi tiết ngoại lệ), chọn cột Number of Outliers (không phải tiêu đề, mà cột bên nó) chọn Drill-Through Definitions (Các định nghĩa truy vấn ngược) từ trình đơn ngữ cảnh nhấn chuột phải Thêm định nghĩa truy vấn ngược (drill-through) Trong thẻ Target Report đặc tính, chọn báo cáo OutlierDetails làm báo cáo 10 Chọn Run the report làm hành động 11 Đánh dấu chọn hộp kiểm tra Open in new window (Mở cửa sổ mới) 12 Thêm tham số liên kết với nút Edit bên danh sách tham số 13 Trong hộp thoại Parameters (Các tham số), chọn Pass data item value (Chuyển giá trị mục liệu qua) làm phương thức để liên kết tham số vào giá trị hàng danh sách 14 Chọn mục truy vấn Profession làm nguồn mục liệu chọn OK Hình 12 Các tham số định nghĩa truy vấn ngược (drill-through) 15 Nhấn OK để lưu định nghĩa truy vấn ngược (drill-through) Hình 13 Trang định nghĩa truy vấn ngược (drill-through) 16 Thay đổi văn tiêu đề lưu báo cáo OutlierOverview 17 Bây bạn chạy báo cáo từ trình đơn Run > Run HTML từ Cognos Connect (Nối Cognos) 18 Nhấn chuột vào liên kết số lượng cột ngoại lệ để xem ghi chi tiết Hình 14 Trang tổng quan ngoại lệ Dự án đơn giản gồm hai ghi Nhờ sử dụng định nghĩa "truy vấn ngược " (drillthrough) có chứa tham số định nghĩa ngữ cảnh liên kết, bạn không cần tạo liên kết cho nghề riêng Các viết tới loạt cho thấy cách thực nhiều điều mạnh mẽ với định nghĩa truy vấn ngược (drill-through), ví dụ cách gọi khai phá liệu động Về đầu trang Kết luận Trong này, bạn tìm hiểu việc phát sai lệch cách thực việc phát sai lệch InfoSphere Warehouse Phát sai lệch nhiệm vụ tương tác cao thường phải kiểm tra ngoại lệ thủ công để xem liệu chúng có cho biết gian lận, lỗi liệu hay số hội thú vị khơng Cognos rất thích hợp để hỗ trợ nhiệm vụ phân tích ngoại lệ tương tác Ngồi kỹ thuật đơn giản sử dụng viết loạt bài, này, bạn tìm hiểu hai kỹ thuật bổ sung Đầu tiên, trích xuất thơng tin bổ sung từ mơ hình khai phá chưa có bảng cho điểm cách sử dụng thủ tục lưu trữ Thứ hai, báo cáo Cognos liên kết cách sử dụng tính "truy vấn ngược " (drill-through), cho phép ghi tương tác với Trong viết tới loạt này, tìm hiểu cách để tiến xa cách gọi khai phá liệu động từ Cognos ... hiểu việc phát sai lệch cách thực việc phát sai lệch InfoSphere Warehouse Phát sai lệch nhiệm vụ tương tác cao thường phải kiểm tra ngoại lệ thủ cơng để xem liệu chúng có cho biết gian lận, lỗi liệu. .. pháp khác để phát sai lệch InfoSphere Warehouse sử dụng phương pháp đặc biệt mạnh mẽ dùng để phát sai lệch dựa phân cụm liệu Phân cụm biểu thị kỹ thuật khai phá liệu để phân nhóm ghi liệu thành... luận điều sau) Hình Dữ liệu mẫu từ bảng kết quả, BANK.CUSTOMER_OL Về đầu trang Tạo báo cáo Cognos tương tác để phát sai lệch Trong phần này, tìm hiểu cách để tạo báo cáo Cognos cho phép bạn kiểm

Ngày đăng: 24/03/2014, 06:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan