Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n

More documents

Recommendations

Info

68 Chương 5: Phân lớp và dự đoán 5.1. Khái niệm cơ bản Kho dữ liệu luôn chứa rất nhiều các thông tin hữu ích có thể dùng cho việc ra các quyết định liên quan đến điều hành, định hướng của một đơn vị, tổ chức. Phân lớp và dự đoán là hai dạng của quá trình phân tích dữ liệu được sử dụng để trích rút các mô hình biểu diễn các lớp dữ liệu quan trọng hoặc dự doán các dữ liệu phát sinh trong tương lai. Kỹ thuật phân tích này giúp cho chúng ta hiểu kỹ hơn về các kho dữ liệu lớn. Ví dụ chúng ta có thể xây dựng một mô hình phân lớp để xác định một giao dịch cho vay của ngân hàn là an toàn hay có rủi ro, hoặc xây dựng mô hình dự đoán để phán đoán khả năng chi tiêu của các khách hàng tiềm năm dựa trên các thông tin liên quan đến thu nhập của họ. Rất nhiều các phương pháp phân lớp và dự đoán được nghiên cứu trong các lĩnh vực máy học, nhận dạng mẫu và thông kê. Hầu hết các thuật toán đều có hạn chế về bộ nhớ với các giả định là kích thước dữ liệu đủ nhỏ. Kỹ thuật khai phá dữ liệu gần đây đã được phát triển để xây dựng các phương pháp phân lớp và dự đoán phù hợp hơn với nguồn dữ liệu có kích thước lớn. 5.1.1. Phân lớp Quá trình phân lớp thực hiện nhiệm vụ xây dựng mô hình các công cụ phân lớp giúp cho việc gán nhãn phân loại cho các dữ liệu. Ví dụ nhãn “An toàn” hoặc “Rủi ro” cho các yêu cầu vay vốn; “Có” hoặc “Không” cho các thông tin thị trường…. Các nhãn dùng phân loại được biểu diễn bằng các giá trị rời rạc trong đó việc sắp xếp chùng là không có ý nghĩa. Phân lớp dữ liệu gồm hai quá trình. Trong quá trình thứ nhất một công cụ phân lớp sẽ được xây dựng để xem xét nguồn dữ liệu. Đây là quá trình học, trong đó một thuật toán phân lớp được xây dựng bằng cách phân tích hoặc “học” từ tập dữ liệu huấn luyện được xây dựng sẵn bao gồm nhiều bộ dữ liệu. Một bộ dữ liệu X biểu diễn bằng một vector n chiều, X = (x1, x2,…, xn) , đây là các giá trị cụ thể của một tập n thuộc tính của nguồn dữ liệu {A1, A2, …, An}. Mỗi bộ được giả sử rằng nó thuộc về một lớp được định nghĩa trước với các nhãn xác định.
69 Hình 5.1. Quá trình học Hình 5.2. Quá trình phân lớp Quá trình đầu tiên của phân lớp có thể được xem như việc xác định ánh xạ hoặc hàm y = f(X), hàm này có thể dự đoán nhãn y cho bộ X. Nghĩa là với mỗi lớp dữ liệu chúng ta cần học (xây dựng) một ánh xạ hoặc một hàm tương ứng. Trong bước thứ hai, mô hình thu được sẽ được sử dụng để phân lớp. Để đảm bảo tính khách quan nên áp dụng mô hình này trên một tập kiểm thử hơn là làm trên tập dữ liệu huấn luyện ban dầu. Tính chính xác của mô hình phân lớp trên tập dữ liệu kiểm thử là số phần trăm các bộ dữ liệu kiểm tra được đánh nhãn đúng bằng cách so sánh chúng với các mẫu trong bộ dữ liệu huấn luyện.
Page 1 and 2:
TRƢỜNG ĐẠI HỌC HÀNG HẢI
Page 3 and 4:
3 Tên học phần: Khai phá dữ
Page 5 and 6:
5 Chương 1. Tổng quan về kho
Page 7 and 8:
7 là dữ liệu tác nghiệp và
Page 9 and 10:
9 Tính tích hợp thể hiện
Page 11 and 12:
11 DW thông thường chứa các
Page 13 and 14:
13 Chương 2: Tổng quan về kha
Page 15 and 16:
15 Hình 2.1. Quy trình phát hi
Page 17 and 18: 17 hiện theo luật có dạng sa
Page 19 and 20: 19 chuẩn đánh giá mô hình v
Page 21 and 22: 21 Cho một lược đồ R={A 1 ,
Page 23 and 24: 23 Khai phá dữ liệu rất khá
Page 25 and 26: 25 là hằng số, một số khá
Page 27 and 28: 27 3. Trình bày các nét khác n
Page 29 and 30: - Tích hợp dữ liệu; - Biến
Page 31 and 32: 31 - Khi làm mịn trung vị tron
Page 33 and 34: 33 này thực sự không có quan
Page 35 and 36: 35 Thực hiện một biến đổ
Page 37 and 38: 37 Hình 3.3. Dữ liệu tổng h
Page 39 and 40: 39 Bài tập: 1. Nếu một thu
Page 41 and 42: 41 nữ là công nhân đặt mua
Page 43 and 44: 43 này, các nhà nghiên cứu đ
Page 45 and 46: Với giá trị độ hỗ trợ t
Page 47 and 48: 47 Tính card( B (S)) Cho S = {s 1
Page 49 and 50: 49 4.4.3. Ví dụ minh hoạ Cho h
Page 51 and 52: Cuối cùng ta có L B,3 = {d 2 ,
Page 53 and 54: 0 2 x a 2. c a ( x; a, b,
Page 55 and 56: 2) x) Min{ A(x), B (x)} nÕu M
Page 57 and 58: 57 Theo lý thuyết tập mờ, m
Page 59 and 60: 59 Cho V F (d 1 ) = (d 11 ,...,d 1n
Page 61 and 62: 61 hợp mờ có độ tin cậy l
Page 63 and 64: 63 7. for ( ứng cử c C t ) 8.
Page 65 and 66: 65 4.5.5.3. Ví dụ minh hoạ thu
Page 67: THỰC HÀNH: 67 2. Nếu các tậ
Page 71 and 72: 71 5. Trả về N thành một nú
Page 73 and 74: MỘT SỐ ĐỀ THI MẪU 73
Page 75 and 76: Trƣờng Đại Học Hàng Hải
Page 77 and 78: Trƣờng Đại Học Hàng Hải
show all

Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

Tá»ng quan vá» khai phÃ¡ dá»¯ liá»u - Äáº¡i há»c Duy TÃ¢n