Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
47<br />
Tính card( B (S))<br />
Cho S = {s 1 , s 2 , … , s k } là tập con của D. Trong đó s j là bộ chỉ báo của S B , j = 1 k. Mỗi<br />
s j tương ứng với vectơ chỉ báo nhị phân v B ({s j }). Các yếu tố của B (S) được tính bằng:<br />
card( B (S)) = card(sup B (v B {s 1 }) B sup B (v B {s 2 }) B … sup B (v B {s k })) (2)<br />
Chúng ta biểu diễn VS B,h là tập con của VS B chứa chỉ vectơ v B (X) trong đó X D và<br />
card(X) = h (h là số nguyên dương cho trước).<br />
4.4.2. Thuật toán phát hiện tập chỉ báo và luật kết hợp nhị phân<br />
Thuật toán phát triển từ thuật toán Apriori-Tid. Để phát hiện các tập chỉ báo nhị phân phổ<br />
biến từ các luật kết hợp nhị phân từ hệ thông tin nhị phân. Thuật toán này làm việc với các bit trong<br />
bộ nhớ và không làm việc với cơ sở dữ liệu trên đĩa, vì thế có thể cải tiến tốc độ quá trình phát hiện<br />
luật. Cho một CSDL và hai ngưỡng độ hỗ trợ tối thiểu minsup và độ tin cậy tối thiểu mincomf của<br />
luật kết hợp. Thuật toán Apriori-Tid có hai pha:<br />
Pha 1: Phát hiện các tập chỉ báo phổ biến dựa trên ngưỡng minsup cho trước.<br />
Pha 2: Xây dựng các luật kết hợp dựa trên một ngưỡng mincom cho trước.<br />
Cho ma trận thông tin nhị phân S B = (O, D, B, ) và một ngưỡng , (0, 1). Trong đó là<br />
minsup và là mincon.<br />
Chi tiết thuật toán Apriori-Tid như sau:<br />
Pha 1: Phát hiện tập chỉ báo phổ biến nhị phân<br />
1. TraLoi = ;<br />
2. Sinh L B,1 từ S B theo thủ tục 1.a. dưới đây ;<br />
3. for (k = 2; L B,k {}; k++)<br />
4.{ Sinh L B,k từ L B,k-1 theo thủ tục 2.a. dưới đây ;<br />
5. TraLoi = k L B,k-1 ;<br />
6. }<br />
7. Return TraLoi ;<br />
// = = = = = = = =<br />
1.a. Sinh L B,1<br />
1. L B,1 = ;<br />
2. for (i = 1; i * card(O))<br />
4. { SaveLargeSet({d i }, VS B,1 ) ;<br />
5. SaveDescriptorVector(v B ({d i }, VS B,1 )) ;<br />
6. }<br />
7. TraLoi = L B , 1 ;