29.01.2015 Views

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

Tổng quan về khai phá dữ liệu - Đại học Duy Tân

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

d 3 1 1 1 1 1 1<br />

d 4 1 1 1 1 1 1<br />

d 5 0 0 1 1 1 1<br />

d 6 0 0 1 1 1 1<br />

60<br />

Bảng 2.3.4.2. Bảng hệ thông tin nhị phân<br />

Ma trận thông tin nhị phân, mỗi (o, d) bằng 1 hoặc 0. Trình diễn này không xem xét số<br />

lượng các chỉ mục mua trong giao dịch vì nếu giao dịch o 1 có 35 chỉ mục của d 3 và giao dịch o 5 chỉ<br />

có một chỉ mục của d 3 mà (o 1 , d 3 ) = (o 5 , d 3 ) = 1. Nếu d 3 là một chỉ mục mà có giá cao, việc bán<br />

hàng của một số lượng nhỏ của d 3 và số lượng lớn của d 3 có sự khác nhau lớn.<br />

Ta dùng các tập mờ MANY, AVERAGE, FEW đối với mỗi chỉ mục mờ. Các hàm thành<br />

viên của các tập mờ này được thích hợp với chỉ mục d là:<br />

d MANY, d AVERAGE , d FEW . Cho d1 MANY,..., dn MANY là n hàm thành viên của n tập mờ<br />

MANY đã thích hợp với n chỉ mục. Chúng ta mờ hoá bằng thông tin trong bảng 2.1 và kết quả được<br />

trình bày trong sau:<br />

d 1 d 2 d 3 d 4 d 5 d 6<br />

d 1 0.8 0.9 0.8 0 0 0<br />

d 2 0.8 0.8 0.8 0 0 0<br />

d 3 0.9 0.8 0.7 0.6 0.6 0.3<br />

d 4 0.6 0.6 0.9 0.6 0.7 0.5<br />

d 5 0 0 0.1 0.7 0.8 0.4<br />

d 6 0 0 0.1 0.6 0.7 0.5<br />

Bảng 2.3.4.3 Bảng hệ thông tin mờ<br />

Trong đó: MANY : O D (0, 1)<br />

Với = 0.5 (50 %), =0.6 (60%). Ta có thể phát hiện từ ma trận thông tin mờ đối với khái<br />

niệm MANY của n mục như {d 1 , d 2 , d 3 }, {d 4 , d 5 }. Tập {d 1 , d 2 , d 3 } có nghĩa là Luật kết hợp mờ<br />

{d 1 , d 2 } {d 3 }, CF F của luật này bằng 1 hay 0 có nghĩa là: “ Có 100 % khách hàng mua MANY<br />

{d 1 , d 2 }, mua MANY d 3 ”.<br />

4.5.4.3. Thuật toán phát hiện tập chỉ báo và các luật kết hợp mờ<br />

Cho ma trận thông tin mờ S F = (O, D, F, ) và các ngưỡng , (0, 1),<br />

Trong đó là MINSUP và là MINCONF. Cho L F là tập của tất cả các tập chỉ báo mờ phổ<br />

biến của S F , L F,k là tập con của L F nếu X L F,k , card(X) = k và R F, là tập tất cả các Luật kết

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!