Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Trƣờng Đại Học Hàng Hải Việt Nam<br />
Khoa Công nghệ Thông tin<br />
BỘ MÔN HỆ THỐNG THÔNG TIN<br />
-----***-----<br />
76<br />
Tên học phần: KHAI PHÁ DỮ LIỆU<br />
Năm học: x<br />
Thời gian: 60 phút<br />
THI KẾT THÚC HỌC PHẦN<br />
Đề thi số:<br />
x<br />
Ký duyệt đề:<br />
x<br />
Câu 1: (2 điểm)<br />
Cho ví dụ về một nguồn dữ liệu lưu trữ có cấu trúc bảng, cấu trúc semi-structured,<br />
hoặc không cấu trúc<br />
Câu 2: (4 điểm)<br />
Cho một cơ sở dữ liệu với 5 giao dịch, giả sử độ min_sup = 60% và min_conf= 80%<br />
TID<br />
Mặt hàng<br />
T100 {M, O, N, K, E, Y}<br />
T200 {D, O, N, K, E, Y}<br />
T300 {M, A, K, E}<br />
T400 {M, U, C, K, Y}<br />
T500 {C, O, O, K, I, E}<br />
a. Tìm tất cả tất cả các tập phổ biến Itemsets sử dụng thuật toán Apriori <br />
b. Liệt kê tất cả các luật kết hợp mạnh (với độ support s, và confidence c) đáp ứng tân<br />
từ sau, trong đó X là biến biểu diễn khách hàng và item i là các biến biểu diễn các mặt<br />
hàng (ví dụ A, B, …)<br />
Câu 3: (2 điểm)<br />
Các bước của quá trình <strong>khai</strong> phá dữ liệu<br />
Câu 4: (2 điểm)<br />
Làm mịn dữ liệu sử dụng kỹ thuật làm tròn cho tập sau:<br />
Y = {1.17, 2.59, 3.38, 4.23, 2.67, 1.73, 2.53, 3.28, 3.44}<br />
Sau đó biểu diễn tập thu được với các độ chính xác:<br />
a. 0.1<br />
b. 1.<br />
----------------------------***HẾT***----------------------------<br />
Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi