29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Trƣờng Đại Học Hàng Hải Việt Nam<br />

Khoa Công nghệ Thông tin<br />

BỘ MÔN HỆ THỐNG THÔNG TIN<br />

-----***-----<br />

75<br />

Tên học phần: KHAI PHÁ DỮ LIỆU<br />

Năm học: x<br />

Thời gian: 60 phút<br />

THI KẾT THÚC HỌC PHẦN<br />

Đề thi số:<br />

x<br />

Ký duyệt đề:<br />

x<br />

Câu 1: (2 điểm)<br />

Trình bày thuật toán Apriori<br />

Câu 2: (4 điểm)<br />

Cho một cơ sở dữ liệu với 5 giao dịch, giả sử độ min_sup = 60% và min_conf= 80%<br />

TID<br />

Mặt hàng<br />

T100 {M, O, N, K, E, Y}<br />

T200 {D, O, N, K, E, Y}<br />

T300 {M, A, K, E}<br />

T400 {M, U, C, K, Y}<br />

T500 {C, O, O, K, I, E}<br />

a. Tìm tất cả tất cả các tập phổ biến Itemsets sử dụng thuật toán Apriori <br />

b. Liệt kê tất cả các luật kết hợp mạnh (với độ support s, và confidence c) đáp ứng tân<br />

từ sau, trong đó X là biến biểu diễn khách hàng và item i là các biến biểu diễn các mặt<br />

hàng (ví dụ A, B, …)<br />

Câu 3: (2 điểm)<br />

Trình bày các điểm khác biệt giữa kho dữ liệu và một cơ sở dữ liệu thông thường<br />

Câu 4: (2 điểm)<br />

Cho tập dữ liệu dùng để phân tích về độ tuổi được sắp xếp tăng dần như sau: {13,<br />

15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46,<br />

52, 70}<br />

a. Sử dụng phương pháp làm mịn trung vị với độ rộng bin là 3. Minh họa các bước<br />

thực hiện<br />

b. Sử dụng phương phương pháp chuẩn hóa decimal-scale để biến đổi giá trị tuổi 35.<br />

----------------------------***HẾT***----------------------------<br />

Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!