Khai_pha_d_liu_data_mining

Recommendations

Info

=> Phơng pháp vét cạn này có chi phí tính toán quá lớn, không áp dụngđợc trong thực tế.Xét tập mục: {Milk, Diaper, Beer}Các luật kết hợp:{Milk, Diaper} →Ō {Beer} (s=0.4,c=0.67){Milk, Beer} →Ō {Diaper} (s=0.4, c=1.0){Diaper, Beer} →Ō {Milk} (s=0.4,c=0.67){Beer} →Ō {Milk, Diaper} (s=0.4, c=0.67){Diaper} →Ō {Milk Beer} (s =04, c=0.5){Milk} →Ō {Diaper, Beer} (s=0.4, c=0.5)Ta thấy tất cả các luật trên đều là sự phân tách (thành 2 tập con) ca cùngtập mục : {Milk, Diaper, Beer}.Các luật sinh ra từ cùng một tập mục sẽ có cùng độ hỗ trợ, nhng có thểkhác về độ tin cậy.Do đó, trong quá trình phát hiện luật kết hợp, chúng ta có thể tách riêng 2yêu cầu về độ hỗ trợ và độ tin cậy.Vây nên quá trình phát hiện luật kết hợp sẽ phân gồm 2 bớc (2 giai đoạn)quan trọng:- Sinh ra các tập mục thng xuyên (frequent/large itemsets): Sinh ra tất cảcác tập mục có độ hỗ trợ ≥ minsup.- Sinh ra các luật kết hợp: Từ mỗi tập mục thng xuyên (thu đợc bớctrên), sinh ra tất cả các luật có độ tin cậy cao( ≥ minconf).Tuy vậy, bớc sinh ra các tập mục thng xuyên (bớc 1) vẫn có chi phítính toán quá cao.23
Với d mục, thì phải xét đến 2 d các tập mục có thể.Lợc đồ biểu diễn các tập mục cần xét, với d = 5Với phơng pháp vét cạn(Brute-force) để sinh ra các tập mục thng xuyên(bớc 1):Hình 1.6.2_Sinh tập mục thường xuyên bằng phương pháp vét cạn- Mỗi tập mục trong lợc đồ đều đợc xét.- Tính độ hỗ trợ ca mỗi tập mục, bằng cách duyệt qua tất cả các giao dịch.- Với mỗi giao dịch, so sánh nó với mỗi tập mục đợc xét.- ĐĚộ phc tạp ~ O(N.M.w). Nếu M = 2 d thì độ phc tạp này là quá lớn.24
Page 1 and 2: Báo CáoMôn Khai Phá Dữ Liệu
Page 3 and 4: 1.6.1. Giới thiệu luật kết
Page 5 and 6: Chơng 1. Tổng Quan Về Khai Ph
Page 7 and 8: Quá trình khai thác tri thc khô
Page 9 and 10: 1.2.2. Làm sạch dữ liệu (dat
Page 11 and 12: Phát hiện và xử lý các mâu
Page 13 and 14: 1.3.2. Tổng quan Hồi quia) Khá
Page 15 and 16: 1.4. Phơng pháp Phân loai1.4.1.
Page 17 and 18: Giải thuật xây dựng cây quy
Page 19 and 20: 1.5. Phơng pháp Gom cụm1.5.1. G
Page 21 and 22: - Lặp lại quá trình đến kh
Page 23: Các ví dụ ca luật kết hợp
Page 27 and 28: null).Xây dựng FP-tree:- Ban đ
Page 29 and 30: 2.1.2. ĐĚánh giá ca thầy sau
Page 31 and 32: Nguyên tắc ca giải thuật Apr
Page 33 and 34: Ví dụ: Với minsup = 2 [1] .4-
Page 35 and 36: Biểu đồ: Số lợng giao dị
Page 37 and 38: - Function calculateInit:+ Input:C:
Page 39 and 40: Username và password ca database.g
Page 41 and 42: Nhập đúng Username và Password
Page 43 and 44: Hình 4.2.2_6Hình 4.2.2_742
Page 45 and 46: Chơng 5. ĐĚánh giá tổng kế

Khai_pha_d_liu_data_mining

Create successful ePaper yourself

Delete template?

Save as template?