29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

62<br />

// Trong đó:<br />

SaveLargeSet(T, L F,k ): là một hàm để ghi một tập chỉ báo phổ biến mờ T vào L F,k .<br />

SaveDecriptorVectơ (V F (T),VS F,k ): là một hàm để ghi một vectơ chỉ báo phổ biến mờ<br />

V F (T) vào VS F,k .<br />

Ta có thể tính rất nhanh sup F (V F (T)) tại bước thứ k của vòng lặp ở trên từ các phần tử của VS F,k-1 .<br />

* Thuật toán phát hiện các luật mờ<br />

1. R F, = ; // Khởi tạo tập rỗng<br />

2. for(mỗi l L F )<br />

3. { for (mỗi X,Y L && X Y = {})<br />

4. { if (Cf F (X Y) <br />

5. Saverule( X Y, R F, );// Lưu lại luật X Y vào R F,<br />

6. if(CFF(Y X) )<br />

7. Saverule( Y X, R F, );// Lưu lại luật YX vào R F,<br />

8. }<br />

9. }<br />

10. Traloi=R F, // Tập luật kết quả thu được<br />

// Saverule( X Y, R F, ) là hàm để ghi luật kết hợp mờ vào R F,<br />

4.5.5. Thuật toán Apriori<br />

4.5.5.1. Ý tưởng thuật toán Apriori<br />

Thuật toán được tỉa bớt những tập ứng cử viên có tập con không phổ biến trước khi tính độ<br />

hỗ trợ.<br />

Thuật toán Apriori tính tất cả các tập ứng cử của tập k trong một lần duyệt CSDL. Apriori<br />

dựa vào cấu trúc cây băm (hashtree). Tìm kiếm đi xuống trên cấu trúc cây mỗi khi ta chạm lá, ta tìm<br />

được một tập ứng cử viên có tiền tố chung được bao gồm trong giao dịch. Sau đó các tập ứng cử<br />

này được tìm trong giao dịch đã được ánh xạ trước đó. Trong trường hợp tìm thấy biến đếm được<br />

tăng lên 1.<br />

4.5.5.2. Thuật toán Apriori<br />

Input: CSDL D minsup.<br />

Output: Tập các tập mục phổ biến.<br />

1. L 1 = {Các 1 - itemset phổ biến};<br />

2. k=2;<br />

3. While( L k-1 ! = )<br />

4. { C k = apriori_gen(L k-1 , minsup);// các ứng cử mới theo chương trình con ở dưới đây.<br />

5. for( giao dịch t D)<br />

6. { C t =Subset (C k ,t);// ứng cử viên được chứa trong t

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!