29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Với giá trị độ hỗ trợ tối thiểu minsup = 50 % thì tập mục phổ biến là:<br />

TT Tập các mục phổ biến Độ hỗ trợ tƣơng ứng<br />

1 Bánh mì 50 %<br />

2 Bơ 100 %<br />

3 Trứng 50 %<br />

4 Bánh mì, Bơ 50 %<br />

5 Bơ, Trứng 50 %<br />

45<br />

Nếu cho độ tin cậy tối thiểu là mincon = 60 % thì ta có các luật sau:<br />

TT Luật Độ tin cậy Thoả mãn ≥ 60%<br />

1 Bánh mì => Bơ 100 % Có<br />

2 Bơ => Bánh mì 50 % Không<br />

3 Bơ =>Trứng 50 % Không<br />

4 Trứng => Bơ 100 % Có<br />

Bảng 2.1. Minh hoạ bài toán phát hiện luật kết hợp<br />

4.4. Phát hiện luật kết hợp dựa trên hệ thông tin nhị phân<br />

4.4.1. Các định nghĩa hình thức trên hệ thông tin nhị phân<br />

Định nghĩa 2.2.3.1: Hệ thông tin nhị phân<br />

Cho các tập sau:<br />

O ={o 1 , o 2 , …, o n } là một tập hữu hạn gồm n đối tượng,<br />

D = {d 1 , d 2 , …, d m } là một tập hữu hạn gồm m chỉ báo,<br />

B = {0, 1}<br />

Hệ thông tin nhị phân được định nghĩa là S B = (O, D, B, ) trong đó là ánh xạ :O x D →<br />

B, (o,d) = 1 nếu đối tượng o có chỉ báo d và (o,d) = 0 nếu ngược lại.<br />

Định nghĩa 2.2.3.2: Các ánh xạ thông tin nhị phân<br />

Cho hệ thông tin nhị phân S B = (O, D, B, ). Cho P(O) là các tập con của O, P(D) là các tập<br />

con của D. Các ánh xạ thông tin nhị phân B và B được định nghĩa như sau:<br />

B : P(D) P(O) với ý nhĩa:<br />

cho S D, B (S) = {o O| d S, (o, d) = 1}<br />

B : P(O) P(D) với ý nhĩa:<br />

cho X O, B (X) = {d D| o X, (o, d) = 1}<br />

Định nghĩa 2.2.3.3: Tập chỉ báo phổ biến nhị phân<br />

Cho hệ thông tin nhị phân S B = (O, D, B, ) và một ngưỡng (0, 1).<br />

Cho S D, S là tập chỉ báo phổ biến nhị phân với ngưỡng nếu:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!