28.04.2020 Views

Sách Deep Learning cơ bản

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

168 Chương 12. Các kỹ thuật cơ bản trong deep learning

• Ở hình 1, thì đường phân chia có khá nhiều điểm bị lỗi => sự chênh lệch giữa mô hình dự

đoán và giá trị thực tế của dữ liệu cao => high bias, hay còn được gọi là underfitting, ý hiểu

là mô hình hiện tại đơn giản hơn và chưa mô tả được mô hình của dữ liệu thực tế.

• Ở hình 2, đường phân chia vẫn có lỗi nhưng ở mức chấp nhận được và nó có thể mô tả dữ

liệu => low bias, low variance.

• Ở hình 3, đường phân chia có thể dự đoán đúng tất cả các điểm trong training set nhưng vì nó

không tổng quát hóa mô hình dữ liệu thực sự nên khi áp dụng dự đoán vào validation set thì

sẽ có rất nhiều lỗi => high variance hay còn được gọi là overfitting, ý hiểu là mô hình hiện

tại thực hiện tốt với dữ liệu trong traing set nhưng dự đoán không tốt với validation set.

Thực ra khái niệm high bias và high variance khá trìu tượng và nhiều lúc dùng nhầm lẫn giữa thống

kê và machine learning. Nên khái niệm hay được dùng hơn là underfitting và overfitting.

Hình 12.3: Các điểm màu xanh là training set, điểm màu đỏ là validation set

Ví dụ khi luyện thi đại học, nếu bạn chỉ luyện khoảng 1-2 đề trước khi thi thì bạn sẽ bị underfitting

vì bạn chưa hiểu hết cấu trúc, nội dung của đề thi. Tuy nhiên nếu bạn chỉ luyện kĩ 50 đề thầy cô

giáo bạn soạn và đưa cho thì khả năng bạn sẽ bị overfitting với các đề mà thầy cô giáo các bạn soạn

mà khi thi đại học có thể điểm số của các bạn vẫn tệ.

12.3.2 Bias, variance tradeoff

Nếu model quá đơn giản thì ta sẽ bị high bias và low variance. Tuy nhiên nếu model quá phức tạp

thì sẽ bị high variance và low bias. Đấy là bias, variance tradeoff. Do đó để train được model tốt ta

cần cân bằng giữa bias và variance.

12.3.3 Đánh giá bias and variance

Có 2 thông số thường được sử dụng để đánh giá bias and variance của mô hình là training set error

và validation set error. Ví dụ error (1-accuracy) trong logistic regression.

Train set error 1% 15% 15% 0.5%

Val set error 11% 16% 30% 1%

High variance High bias High bias High variance Low bias Low variance

Ta mong muốn model là low bias và low variance. Cùng xem một số cách để giải quyết vấn đề high

bias hoặc high variance nhé.

Giải quyết high bias (underfitting): Ta cần tăng độ phức tạp của model

• Tăng số lượng hidden layer và số node trong mỗi hidden layer.

• Dùng nhiều epochs hơn để train model.

Giải quyết high variance (overfitting):

• Thu thập thêm dữ liệu hoặc dùng data augmentation

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!