Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Bài tập:<br />
LÝ THUYẾT:<br />
1. Các giá trị thông thường được sử dụng làm tham số cho độ support và confidence trong<br />
thuật toán Apriori<br />
2. Tại sao quá trình khám phá luật kết lợp khá đơn giản khi so sánh nó với việc phát sinh một<br />
lượng lớn itemset trong cơ sở dữ liệu giao dịch<br />
3. Cho cơ sở dữ liệu giao dịch như sau:<br />
X: TID Items<br />
66<br />
T01 A, B, C, D<br />
T02 A, C, D, F<br />
T03 C, D, E, G, A<br />
T04 A, D, F, B<br />
T05 B, C, G<br />
T06 D, F, G<br />
T07 A, B, G<br />
T08 C, D, F, G<br />
a. Sử dụng các giá trị ngưỡng support = 25% và confidence = 60%, tìm:<br />
1. Tất cả các tập itemsets trong cơ sở dữ liệu X.<br />
2. Các luật kết hợp đáng tin cậy.<br />
5. Cho cơ sở dữ liệu giao dịch như sau:<br />
Y: TID Items<br />
T01 A1, B1, C2<br />
T02 A2, C1, D1<br />
T03 B2, C2, E2<br />
T04 B1, C1, E1<br />
T05 A3, C3, E2<br />
T06 C1, D2, E2<br />
a. Sử dụng các ngưỡng support s = 30% và confidence c = 60%, tìm:<br />
1. Tất cả các tập itemset trong Y.