Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
62<br />
// Trong đó:<br />
SaveLargeSet(T, L F,k ): là một hàm để ghi một tập chỉ báo phổ biến mờ T vào L F,k .<br />
SaveDecriptorVectơ (V F (T),VS F,k ): là một hàm để ghi một vectơ chỉ báo phổ biến mờ<br />
V F (T) vào VS F,k .<br />
Ta có thể tính rất nhanh sup F (V F (T)) tại bước thứ k của vòng lặp ở trên từ các phần tử của VS F,k-1 .<br />
* Thuật toán phát hiện các luật mờ<br />
1. R F, = ; // Khởi tạo tập rỗng<br />
2. for(mỗi l L F )<br />
3. { for (mỗi X,Y L && X Y = {})<br />
4. { if (Cf F (X Y) <br />
5. Saverule( X Y, R F, );// Lưu lại luật X Y vào R F,<br />
6. if(CFF(Y X) )<br />
7. Saverule( Y X, R F, );// Lưu lại luật YX vào R F,<br />
8. }<br />
9. }<br />
10. Traloi=R F, // Tập luật kết quả thu được<br />
// Saverule( X Y, R F, ) là hàm để ghi luật kết hợp mờ vào R F,<br />
4.5.5. Thuật toán Apriori<br />
4.5.5.1. Ý tưởng thuật toán Apriori<br />
Thuật toán được tỉa bớt những tập ứng cử viên có tập con không phổ biến trước khi tính độ<br />
hỗ trợ.<br />
Thuật toán Apriori tính tất cả các tập ứng cử của tập k trong một lần duyệt CSDL. Apriori<br />
dựa vào cấu trúc cây băm (hashtree). Tìm kiếm đi xuống trên cấu trúc cây mỗi khi ta chạm lá, ta tìm<br />
được một tập ứng cử viên có tiền tố chung được bao gồm trong giao dịch. Sau đó các tập ứng cử<br />
này được tìm trong giao dịch đã được ánh xạ trước đó. Trong trường hợp tìm thấy biến đếm được<br />
tăng lên 1.<br />
4.5.5.2. Thuật toán Apriori<br />
Input: CSDL D minsup.<br />
Output: Tập các tập mục phổ biến.<br />
1. L 1 = {Các 1 - itemset phổ biến};<br />
2. k=2;<br />
3. While( L k-1 ! = )<br />
4. { C k = apriori_gen(L k-1 , minsup);// các ứng cử mới theo chương trình con ở dưới đây.<br />
5. for( giao dịch t D)<br />
6. { C t =Subset (C k ,t);// ứng cử viên được chứa trong t