29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

47<br />

Tính card( B (S))<br />

Cho S = {s 1 , s 2 , … , s k } là tập con của D. Trong đó s j là bộ chỉ báo của S B , j = 1 k. Mỗi<br />

s j tương ứng với vectơ chỉ báo nhị phân v B ({s j }). Các yếu tố của B (S) được tính bằng:<br />

card( B (S)) = card(sup B (v B {s 1 }) B sup B (v B {s 2 }) B … sup B (v B {s k })) (2)<br />

Chúng ta biểu diễn VS B,h là tập con của VS B chứa chỉ vectơ v B (X) trong đó X D và<br />

card(X) = h (h là số nguyên dương cho trước).<br />

4.4.2. Thuật toán phát hiện tập chỉ báo và luật kết hợp nhị phân<br />

Thuật toán phát triển từ thuật toán Apriori-Tid. Để phát hiện các tập chỉ báo nhị phân phổ<br />

biến từ các luật kết hợp nhị phân từ hệ thông tin nhị phân. Thuật toán này làm việc với các bit trong<br />

bộ nhớ và không làm việc với cơ sở dữ liệu trên đĩa, vì thế có thể cải tiến tốc độ quá trình phát hiện<br />

luật. Cho một CSDL và hai ngưỡng độ hỗ trợ tối thiểu minsup và độ tin cậy tối thiểu mincomf của<br />

luật kết hợp. Thuật toán Apriori-Tid có hai pha:<br />

Pha 1: Phát hiện các tập chỉ báo phổ biến dựa trên ngưỡng minsup cho trước.<br />

Pha 2: Xây dựng các luật kết hợp dựa trên một ngưỡng mincom cho trước.<br />

Cho ma trận thông tin nhị phân S B = (O, D, B, ) và một ngưỡng , (0, 1). Trong đó là<br />

minsup và là mincon.<br />

Chi tiết thuật toán Apriori-Tid như sau:<br />

Pha 1: Phát hiện tập chỉ báo phổ biến nhị phân<br />

1. TraLoi = ;<br />

2. Sinh L B,1 từ S B theo thủ tục 1.a. dưới đây ;<br />

3. for (k = 2; L B,k {}; k++)<br />

4.{ Sinh L B,k từ L B,k-1 theo thủ tục 2.a. dưới đây ;<br />

5. TraLoi = k L B,k-1 ;<br />

6. }<br />

7. Return TraLoi ;<br />

// = = = = = = = =<br />

1.a. Sinh L B,1<br />

1. L B,1 = ;<br />

2. for (i = 1; i * card(O))<br />

4. { SaveLargeSet({d i }, VS B,1 ) ;<br />

5. SaveDescriptorVector(v B ({d i }, VS B,1 )) ;<br />

6. }<br />

7. TraLoi = L B , 1 ;

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!