Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n

More documents

Recommendations

Info

56 4.5.2.4. Phép bằng nhau Tập mờ A bằng tập mờ B, ký hiệu A = B (A) = (B) 4.5.2.5. Tập con Cho hai tập mờ A, B. Ta có A B A (x) ≤ B (x) 4.5.2.6. Luật DeMorgan Như trên đã trình bày việc xây dựng hàm liên cho các phép toán các tập mờ thoả mãn các điều kiện nhất định hoàn toàn độc lập nhau, tuy nhiên công thức Demorgan không phải luôn đúng cho mọi cặp hàm liên thuộc của phép hợp và giao. Ví dụ khi phép hợp ta chọn theo công thức Max thì công thức giao tương ứng là Min, ta có Với công thức A B A B trong tập kinh điển thì A AB (x) 1- (x) 1 Max( (x), (x)) Min(1 (x),1 (x)) B AB A B A B Min( (x), (x)) A B AB Với công thức A B A B trong tập kinh điển thì (x) 1- (x) 1 Min( (x), (x)) Max(1 (x),1 (x)) A AB Max( (x), (x)) B AB A B Tương tự như vậy nếu ta lấy hàm liên thuộc công thức (4) trong phép hợp hai tập mờ tương ứng với công thức (4) trong phép giao hai tập mờ, ta có AB (x) 1- AB (x) (x) 1 (x) (x) (x) (x) A B A B A B (x) 1 1 (x) (x) 1 (x) (x) (x) (x) A B (x) A B 2 (x) (x) (x) (x ) A B (1 (x)(1 (x)) A B 2 (1 (x))(1 (x)) (1 (x)) (1 (x)) A 1 (x) (x) (x) (x) A B A B 1 (x) (x) A B B A A A B B B A A B B So sánh vế phải của hai biểu thức trên ta có (x) (x) AB AB 4.5.3. Áp dụng tập mờ để rời rạc hoá dữ liệu và ƣu điểm của phƣơng pháp này 4.5.3.1. Phương pháp áp dụng
57 Theo lý thuyết tập mờ, một phần tử thuộc vào một tập nào đó với một “mức độ thuộc” (membership value) nằm trong khoảng [0, 1]. Giá trị này được xác định dựa vào hàm thuộc (membership function) tương ứng với mỗi tập mờ. Bây giờ, chúng ta áp dụng khái niệm tập mờ vào việc rời rạc hoá dữ liệu để giải quyết một số vấn đề còn vướng mắc nêu trên. Đối với những thuộc tính hạng mục A (bao gồm cả thuộc tính nhị phân ) có các tập giá trị {V 1 , V 2 ,. . . , V k } và k không quá lớn thì gắn với mỗi giá trị V i một tập mờ A_Vi (A là tên thuộc tính) có hàm thuộc A-Vi xác định như sau: A-Vi = 1 (nếu x = V i ) Và A-Vi = 1 (nếu x V i ) Thực ra A_Vi giống như tập rõ vì giá trị hàm thuộc của nó chỉ là 0 hoặc 1. Trường hợp k quá lớn, chúng ta có thể chia và gán tập mờ cho từng khoảng. 4.5.3.2. Các ưu điểm của áp dụng tập mờ để rời rạc hoá dữ liệu Ưu điểm thứ nhất: Giải quyết được vấn đề “điểm biên gãy” nhờ tập mờ có thể phân khoảng mịn hơn nhờ vào “độ trơn” của hàm thuộc. Ưu điểm thứ hai: Rời rạc hoá bằng phân khoảng đôi khi tạo ra số khoảng rất lớn và do đó số thuộc tính nhị phân cũng rất lớn. Còn khi sử dụng tập mờ thì số lượng tập mờ gắn với mỗi thuộc tính là không đáng kể. Ví dụ, áp dụng phân khoảng cho thuộc tính giờ bắt đầu gọi trong ngày chúng ta sẽ thu được 24 khoảng trong [0, 23] mỗi khoảng tương ứng cách nhau một giờ, còn khi áp dụng tập mờ thì ta chỉ cần hai tập mờ là giờ_thấp_điểm và giờ_cao_điểm. Ưu điểm thứ ba: Tập mờ cho phép chúng ta biểu diễn luật kết hợp dưới dạng tự nhiên hơn và gần gũi hơn với người sử dụng. Ưu điểm thứ tư: Giá trị thuộc tính sau khi rời rạc hoá (sau khi tính qua hàm phụ thuộc) biến thiên trong khoảng [0, 1] cho biết “mức độ thuộc” ít hay nhiều trong khi đó các thuộc tính nhị phân trước đây chỉ có một trong hai giá trị 0, 1. Điều này cho chúng ta khả năng ước lượng chính xác hơn “độ đóng góp” của các bản ghi trong cơ sở dữ liệu vào một tập phổ biến nào đó. Ưu điểm thứ năm: Các thuộc tính mặc dầu đã được mờ hoá, nhưng vẫn giữ nguyên được một số tính chất của thuộc tính nhị phân, do đó vẫn có thể áp dụng các thuật toán khai phá luật kết hợp nhị phân vào khai phá luật kết hợp mờ với một vài thay đổi. Ví dụ tính chất “ mọi tập con khác rỗng của tập phổ biến cũng là tập phổ biến và mọi tập chứa tập không phổ biến đều là tập không phổ biến” vẫn còn đúng nếu chúng ta chon được phép toán T-norm (T-chuẩn) phù hợp. Một ưu điểm nữa đối với rời rạc hoá dựa vào tập mờ là nó có thể áp dụng tốt cho cả hai dạng cơ sở dữ liệu: cơ sở dữ liệu quan hệ (relation databases) và cơ sở dữ liệu dạng giao tác (transactional databases). 4.5.4. Luật kết hợp trên hệ thông tin mờ (luật kết hợp mờ) 4.5.4.1. Các định nghĩa hình thức trên hệ thông tin mờ
Page 1 and 2:
TRƢỜNG ĐẠI HỌC HÀNG HẢI
Page 3 and 4:
3 Tên học phần: Khai phá dữ
Page 5 and 6: 5 Chương 1. Tổng quan về kho
Page 7 and 8: 7 là dữ liệu tác nghiệp và
Page 9 and 10: 9 Tính tích hợp thể hiện
Page 11 and 12: 11 DW thông thường chứa các
Page 13 and 14: 13 Chương 2: Tổng quan về kha
Page 15 and 16: 15 Hình 2.1. Quy trình phát hi
Page 17 and 18: 17 hiện theo luật có dạng sa
Page 19 and 20: 19 chuẩn đánh giá mô hình v
Page 21 and 22: 21 Cho một lược đồ R={A 1 ,
Page 23 and 24: 23 Khai phá dữ liệu rất khá
Page 25 and 26: 25 là hằng số, một số khá
Page 27 and 28: 27 3. Trình bày các nét khác n
Page 29 and 30: - Tích hợp dữ liệu; - Biến
Page 31 and 32: 31 - Khi làm mịn trung vị tron
Page 33 and 34: 33 này thực sự không có quan
Page 35 and 36: 35 Thực hiện một biến đổ
Page 37 and 38: 37 Hình 3.3. Dữ liệu tổng h
Page 39 and 40: 39 Bài tập: 1. Nếu một thu
Page 41 and 42: 41 nữ là công nhân đặt mua
Page 43 and 44: 43 này, các nhà nghiên cứu đ
Page 45 and 46: Với giá trị độ hỗ trợ t
Page 47 and 48: 47 Tính card( B (S)) Cho S = {s 1
Page 49 and 50: 49 4.4.3. Ví dụ minh hoạ Cho h
Page 51 and 52: Cuối cùng ta có L B,3 = {d 2 ,
Page 53 and 54: 0 2 x a 2. c a ( x; a, b,
Page 55: 2) x) Min{ A(x), B (x)} nÕu M
Page 59 and 60: 59 Cho V F (d 1 ) = (d 11 ,...,d 1n
Page 61 and 62: 61 hợp mờ có độ tin cậy l
Page 63 and 64: 63 7. for ( ứng cử c C t ) 8.
Page 65 and 66: 65 4.5.5.3. Ví dụ minh hoạ thu
Page 67 and 68: THỰC HÀNH: 67 2. Nếu các tậ
Page 69 and 70: 69 Hình 5.1. Quá trình học Hì
Page 71 and 72: 71 5. Trả về N thành một nú
Page 73 and 74: MỘT SỐ ĐỀ THI MẪU 73
Page 75 and 76: Trƣờng Đại Học Hàng Hải
Page 77 and 78: Trƣờng Đại Học Hàng Hải
show all

Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n