Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Tá»ng quan vá» khai phá dữ liá»u - Äại há»c Duy Tân
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
card( B (S)) ≥ *card(O)<br />
Cho L B là một tập gồm tất cả các tập chỉ báo phổ biến nhị phân đã phát hiện từ S B , chúng có<br />
thuộc tính như sau: S L B , T S thì T L B .<br />
Trong đó L B,h là tập con của L B nếu X L B,h thì card(X) = h (với h là số nguyên dương).<br />
Định nghĩa 2.2.3.4: Các luật kết hợp phổ biến nhị phân và hệ số tin cậy<br />
Cho hệ thông tin nhị phân S B = (O, D, B, ) và một ngưỡng (0, 1). Cho L là một phần tử<br />
của L B , X và Y là hai tập con của L, trong đó:<br />
L = X Y, X ≠ {}, Y ≠ {} và X Y = {}<br />
Chúng ta xác định các luật kết hợp nhị phân giữa tập chỉ số X và tập chỉ số Y là một ánh xạ<br />
thông tin: X Y. Hệ số tin cậy của luật này được biểu diễn là:<br />
card ( B<br />
( X ) B<br />
( Y))<br />
CF B<br />
( X Y)<br />
<br />
(2.2.3.1)<br />
card ( ( X ))<br />
B<br />
Ta biểu diễn R B, là tập tất cả các luật kết hợp phổ biến nhị phân được phát hiện tự S B .<br />
Trong đó CF B (r) ≥ , r R B,<br />
Định nghĩa 2.2.3.5: Các vectơ chỉ báo nhị phân và các phép toán<br />
Cho hệ thông tin nhị phân S B = (O, D, B, ) trong đó O ={o 1 , o 2 , …, o n } là một tập hữu hạn<br />
gồm n đối tượng, D = {d 1 , d 2 , …, d m } là một tập hữu hạn gồm m chỉ báo.<br />
Vectơ chỉ báo nhị phân<br />
Vectơ chỉ báo nhị phân v B (X) = {X 1 , X 2 , … , X n } trong đó: X D là một vectơ với n thành<br />
phần, mỗi thành phần X j chiếm một giá trị trong B. Cho VS B là tập tất cả các vectơ chỉ báo<br />
nhị phân của S B , nếu card(X) = 1 thì X là bộ chỉ báo của S B và X j = (o, X)<br />
Định nghĩa 2.2.3.6: Tích vectơ chỉ báo nhị phân<br />
Cho X 1 , X 2 D, v B (X 1 ) = (X 11 , X 12 , … , X 1n ), v B (X 2 ) = (X 21 , X 22 , … , X 2n ) là các phần tử<br />
của VS B . Tích vectơ chỉ báo nhị phân v B (X 1 ) và v B (X 2 ) được biểu hiện là v B (X 3 ) = v B (X 1 ) B<br />
v B (X 2 ). Trong đó:<br />
v B (X 3 ) = (X 31 , X 32 , … , X 3n ) với X 3j = min(X 1j , X 2j ), j = 1n<br />
X 3 = X 1 X 2 D<br />
Từ vectơ v B (X 3 ), chúng ta biết tất cả các đối tượng hiện có trong tập chỉ báo X 1 và X 2 .<br />
Chúng ta dùng v B (X 1 ) để trình diễn B (X 1 ), v B (X 2 ) để trình diễn B (X 2 ) và v B (X 3 ) để trình diễn<br />
B (X 3 ).<br />
Định nghĩa 2.2.3.7: Độ hỗ trợ các vectơ chỉ báo nhị phân<br />
Cho X 1 D, độ hỗ trợ của v B (X 1 ) biểu diễn sup B (v B (X 1 )) được định nghĩa là: sup B (v B (X 1 ))<br />
= {o O| d X 1 , (o, d) = 1} (1)<br />
Dễ thấy rằng: card(sup B (v B (X 1 ))) = card( B (X 1 ))<br />
46