29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Trƣờng Đại Học Hàng Hải Việt Nam<br />

Khoa Công nghệ Thông tin<br />

BỘ MÔN HỆ THỐNG THÔNG TIN<br />

-----***-----<br />

76<br />

Tên học phần: KHAI PHÁ DỮ LIỆU<br />

Năm học: x<br />

Thời gian: 60 phút<br />

THI KẾT THÚC HỌC PHẦN<br />

Đề thi số:<br />

x<br />

Ký duyệt đề:<br />

x<br />

Câu 1: (2 điểm)<br />

Cho ví dụ về một nguồn dữ liệu lưu trữ có cấu trúc bảng, cấu trúc semi-structured,<br />

hoặc không cấu trúc<br />

Câu 2: (4 điểm)<br />

Cho một cơ sở dữ liệu với 5 giao dịch, giả sử độ min_sup = 60% và min_conf= 80%<br />

TID<br />

Mặt hàng<br />

T100 {M, O, N, K, E, Y}<br />

T200 {D, O, N, K, E, Y}<br />

T300 {M, A, K, E}<br />

T400 {M, U, C, K, Y}<br />

T500 {C, O, O, K, I, E}<br />

a. Tìm tất cả tất cả các tập phổ biến Itemsets sử dụng thuật toán Apriori <br />

b. Liệt kê tất cả các luật kết hợp mạnh (với độ support s, và confidence c) đáp ứng tân<br />

từ sau, trong đó X là biến biểu diễn khách hàng và item i là các biến biểu diễn các mặt<br />

hàng (ví dụ A, B, …)<br />

Câu 3: (2 điểm)<br />

Các bước của quá trình <strong>khai</strong> phá dữ liệu<br />

Câu 4: (2 điểm)<br />

Làm mịn dữ liệu sử dụng kỹ thuật làm tròn cho tập sau:<br />

Y = {1.17, 2.59, 3.38, 4.23, 2.67, 1.73, 2.53, 3.28, 3.44}<br />

Sau đó biểu diễn tập thu được với các độ chính xác:<br />

a. 0.1<br />

b. 1.<br />

----------------------------***HẾT***----------------------------<br />

Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!