29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Bài tập:<br />

LÝ THUYẾT:<br />

1. Các giá trị thông thường được sử dụng làm tham số cho độ support và confidence trong<br />

thuật toán Apriori<br />

2. Tại sao quá trình khám phá luật kết lợp khá đơn giản khi so sánh nó với việc phát sinh một<br />

lượng lớn itemset trong cơ sở dữ liệu giao dịch<br />

3. Cho cơ sở dữ liệu giao dịch như sau:<br />

X: TID Items<br />

66<br />

T01 A, B, C, D<br />

T02 A, C, D, F<br />

T03 C, D, E, G, A<br />

T04 A, D, F, B<br />

T05 B, C, G<br />

T06 D, F, G<br />

T07 A, B, G<br />

T08 C, D, F, G<br />

a. Sử dụng các giá trị ngưỡng support = 25% và confidence = 60%, tìm:<br />

1. Tất cả các tập itemsets trong cơ sở dữ liệu X.<br />

2. Các luật kết hợp đáng tin cậy.<br />

5. Cho cơ sở dữ liệu giao dịch như sau:<br />

Y: TID Items<br />

T01 A1, B1, C2<br />

T02 A2, C1, D1<br />

T03 B2, C2, E2<br />

T04 B1, C1, E1<br />

T05 A3, C3, E2<br />

T06 C1, D2, E2<br />

a. Sử dụng các ngưỡng support s = 30% và confidence c = 60%, tìm:<br />

1. Tất cả các tập itemset trong Y.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!