29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

card( B (S)) ≥ *card(O)<br />

Cho L B là một tập gồm tất cả các tập chỉ báo phổ biến nhị phân đã phát hiện từ S B , chúng có<br />

thuộc tính như sau: S L B , T S thì T L B .<br />

Trong đó L B,h là tập con của L B nếu X L B,h thì card(X) = h (với h là số nguyên dương).<br />

Định nghĩa 2.2.3.4: Các luật kết hợp phổ biến nhị phân và hệ số tin cậy<br />

Cho hệ thông tin nhị phân S B = (O, D, B, ) và một ngưỡng (0, 1). Cho L là một phần tử<br />

của L B , X và Y là hai tập con của L, trong đó:<br />

L = X Y, X ≠ {}, Y ≠ {} và X Y = {}<br />

Chúng ta xác định các luật kết hợp nhị phân giữa tập chỉ số X và tập chỉ số Y là một ánh xạ<br />

thông tin: X Y. Hệ số tin cậy của luật này được biểu diễn là:<br />

card ( B<br />

( X ) B<br />

( Y))<br />

CF B<br />

( X Y)<br />

<br />

(2.2.3.1)<br />

card ( ( X ))<br />

B<br />

Ta biểu diễn R B, là tập tất cả các luật kết hợp phổ biến nhị phân được phát hiện tự S B .<br />

Trong đó CF B (r) ≥ , r R B,<br />

Định nghĩa 2.2.3.5: Các vectơ chỉ báo nhị phân và các phép toán<br />

Cho hệ thông tin nhị phân S B = (O, D, B, ) trong đó O ={o 1 , o 2 , …, o n } là một tập hữu hạn<br />

gồm n đối tượng, D = {d 1 , d 2 , …, d m } là một tập hữu hạn gồm m chỉ báo.<br />

Vectơ chỉ báo nhị phân<br />

Vectơ chỉ báo nhị phân v B (X) = {X 1 , X 2 , … , X n } trong đó: X D là một vectơ với n thành<br />

phần, mỗi thành phần X j chiếm một giá trị trong B. Cho VS B là tập tất cả các vectơ chỉ báo<br />

nhị phân của S B , nếu card(X) = 1 thì X là bộ chỉ báo của S B và X j = (o, X)<br />

Định nghĩa 2.2.3.6: Tích vectơ chỉ báo nhị phân<br />

Cho X 1 , X 2 D, v B (X 1 ) = (X 11 , X 12 , … , X 1n ), v B (X 2 ) = (X 21 , X 22 , … , X 2n ) là các phần tử<br />

của VS B . Tích vectơ chỉ báo nhị phân v B (X 1 ) và v B (X 2 ) được biểu hiện là v B (X 3 ) = v B (X 1 ) B<br />

v B (X 2 ). Trong đó:<br />

v B (X 3 ) = (X 31 , X 32 , … , X 3n ) với X 3j = min(X 1j , X 2j ), j = 1n<br />

X 3 = X 1 X 2 D<br />

Từ vectơ v B (X 3 ), chúng ta biết tất cả các đối tượng hiện có trong tập chỉ báo X 1 và X 2 .<br />

Chúng ta dùng v B (X 1 ) để trình diễn B (X 1 ), v B (X 2 ) để trình diễn B (X 2 ) và v B (X 3 ) để trình diễn<br />

B (X 3 ).<br />

Định nghĩa 2.2.3.7: Độ hỗ trợ các vectơ chỉ báo nhị phân<br />

Cho X 1 D, độ hỗ trợ của v B (X 1 ) biểu diễn sup B (v B (X 1 )) được định nghĩa là: sup B (v B (X 1 ))<br />

= {o O| d X 1 , (o, d) = 1} (1)<br />

Dễ thấy rằng: card(sup B (v B (X 1 ))) = card( B (X 1 ))<br />

46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!