29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

78<br />

Trƣờng Đại Học Hàng Hải Việt Nam<br />

Khoa Công nghệ Thông tin<br />

BỘ MÔN HỆ THỐNG THÔNG TIN<br />

-----***-----<br />

THI KẾT THÚC HỌC PHẦN<br />

Tên học phần: KHAI PHÁ DỮ LIỆU<br />

Năm học: x<br />

Thời gian: 60 phút<br />

Đề thi số:<br />

x<br />

Ký duyệt đề:<br />

x<br />

Câu 1: (2 điểm)<br />

Kỹ thuật <strong>khai</strong> phá dữ liệu bao gồm những điểm cơ bản nào<br />

Câu 2: (4 điểm)<br />

Cho một cơ sở dữ liệu với 5 giao dịch, giả sử độ min_sup = 60% và min_conf= 80%<br />

TID<br />

Mặt hàng<br />

T100 {M, O, N, K, E, Y}<br />

T200 {D, O, N, K, E, Y}<br />

T300 {M, A, K, E}<br />

T400 {M, U, C, K, Y}<br />

T500 {C, O, O, K, I, E}<br />

a. Tìm tất cả tất cả các tập phổ biến Itemsets sử dụng thuật toán Apriori <br />

b. Liệt kê tất cả các luật kết hợp mạnh (với độ support s, và confidence c) đáp ứng tân<br />

từ sau, trong đó X là biến biểu diễn khách hàng và item i là các biến biểu diễn các mặt<br />

hàng (ví dụ A, B, …)<br />

Câu 3: (2 điểm)<br />

Trình bày khái niệm dự đoán, cho ví dụ và phân tích<br />

Câu 4: (2 điểm)<br />

Nếu các tập itemset được cấu trúc sao cho A + {A1, A2, A3}, B= {B1, B2}, C = {C1, C2, C3},<br />

D = {D1, D2} và E = {E1, E2}<br />

a. Hãy tìm các tập itemset được định nghĩa trên mức độ khái niệm<br />

b. Tìm các luật kết hợp đáng tin cậy cho các tập itemset ở câu trên.<br />

----------------------------***HẾT***----------------------------<br />

Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!