05.11.2023 Views

Khai_pha_d_liu_data_mining

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.2. ĐĚánh giá giải thuật Apriori

Các yếu tố ảnh hng:

- Lựa chọn giá trị ngỡng minsup: Giá trị minsup quá thấp sẽ sinh ra nhiều

tập mục thng xuyên. ĐĚiều này sẽ làm tăĕng số lợng tập mục phải xét.

- Số lợng các mục trong cơ s dữ liệu (các giao dịch): Cần thêm bộ nhớ để

lu giá trị độ hỗ trợ với mỗi mục. Nếu số lợng các mục(tập mục mc 1) thng

xuyên tăĕng lên thì chi phí và chi phí I/O (duyệt các giao dịch) cũǜng tăĕng.

- Kích thớc ca cơ s dữ liệu (các giao dịch): Giải thuật phải duyệt cơ s

dữ liệu nhiều lần, do đó chi phí tính toán ca Apriori tăĕng lên khi số lợng các giao

dịch tăĕng lên.

- Kích thớc trung bình ca các giao dịch: Khi kích thớc (số lợng các

mục) trung bình ca các giao dịch tăĕng lên, thì độ dài tối đa ca các tập mục

thng xuyên cũǜng tăĕng.

So sánh giữa giải thuật Apriori và giải thuật FP-Growth

Biểu đồ: ĐĚộ hỗ trợ - Thi gian chạy

33

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!