Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
78<br />
Trƣờng Đại Học Hàng Hải Việt Nam<br />
Khoa Công nghệ Thông tin<br />
BỘ MÔN HỆ THỐNG THÔNG TIN<br />
-----***-----<br />
THI KẾT THÚC HỌC PHẦN<br />
Tên học phần: KHAI PHÁ DỮ LIỆU<br />
Năm học: x<br />
Thời gian: 60 phút<br />
Đề thi số:<br />
x<br />
Ký duyệt đề:<br />
x<br />
Câu 1: (2 điểm)<br />
Kỹ thuật <strong>khai</strong> phá dữ liệu bao gồm những điểm cơ bản nào<br />
Câu 2: (4 điểm)<br />
Cho một cơ sở dữ liệu với 5 giao dịch, giả sử độ min_sup = 60% và min_conf= 80%<br />
TID<br />
Mặt hàng<br />
T100 {M, O, N, K, E, Y}<br />
T200 {D, O, N, K, E, Y}<br />
T300 {M, A, K, E}<br />
T400 {M, U, C, K, Y}<br />
T500 {C, O, O, K, I, E}<br />
a. Tìm tất cả tất cả các tập phổ biến Itemsets sử dụng thuật toán Apriori <br />
b. Liệt kê tất cả các luật kết hợp mạnh (với độ support s, và confidence c) đáp ứng tân<br />
từ sau, trong đó X là biến biểu diễn khách hàng và item i là các biến biểu diễn các mặt<br />
hàng (ví dụ A, B, …)<br />
Câu 3: (2 điểm)<br />
Trình bày khái niệm dự đoán, cho ví dụ và phân tích<br />
Câu 4: (2 điểm)<br />
Nếu các tập itemset được cấu trúc sao cho A + {A1, A2, A3}, B= {B1, B2}, C = {C1, C2, C3},<br />
D = {D1, D2} và E = {E1, E2}<br />
a. Hãy tìm các tập itemset được định nghĩa trên mức độ khái niệm<br />
b. Tìm các luật kết hợp đáng tin cậy cho các tập itemset ở câu trên.<br />
----------------------------***HẾT***----------------------------<br />
Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi