16.09.2015 Views

BÁO CÁO TỔNG HỢP

tại dây - Việt Nam

tại dây - Việt Nam

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

áo và do đó tại mỗi điểm trạm số biến có thể sử dụng làm nhân tố dự báo sẽ lớn hơn<br />

21. Khác với phương pháp lấy điểm gần nhất, theo phương pháp này mọi điểm trạm sẽ<br />

cùng chung tập các nhân tố dự báo có thể. Khó khăn chủ yếu với phương pháp này<br />

nằm ở khâu lựa chọn miền xác định các thành phần chính.<br />

Để có một tập nhân tố dự báo với bậc độ lớn tương đương, các nhân tố dự báo<br />

cần được chuẩn hóa trước khi xây dựng phương trình thống kê. Điều này khá hiển<br />

nhiên, nếu quan sát các biến dự báo ở trên có thể thấy với một tập lớn các biến dự báo<br />

được đưa vào tuyển chọn, bậc độ lớn biến thiên khá rộng. Tất nhiên các biến này khác<br />

nhau về thứ nguyên và không thể so sánh với nhau, nhưng phương trình thống kê xem<br />

các nhân tố dự báo như nhau, không phân biệt thứ nguyên. Bậc độ lớn chênh lệch quá<br />

lớn giữa các nhân tố dự báo sẽ dẫn đến sai sót trong xây dựng phương trình thống kê<br />

khi các đại lượng quá lớn hay quá nhỏ sẽ bị bỏ qua. Để khắc phục vấn đề này, tập hợp<br />

các nhân tố dự báo sẽ được chuẩn hóa về một tập hợp nhân tố mới theo công thức như<br />

sau:<br />

x<br />

− x<br />

k k<br />

xˆ k<br />

=<br />

(5.3.1)<br />

sdk<br />

ở đây xˆ<br />

k<br />

là giá trị chuẩn hóa của nhân tố dự báo thứ x<br />

k<br />

, xk<br />

và sdk<br />

tương ứng là<br />

giá trị trung bình và độ lệch chuẩn của nhân tố x k xác định từ tập số liệu quá khứ. Sau<br />

khi được chuẩn hóa, các nhân tố mới xˆ<br />

k<br />

là vô thứ nguyên và có giá trị tập trung trong<br />

khoảng từ -3 cho đến +3.<br />

Quá trình tuyển chọn nhân tố sẽ được thực hiện dựa theo chỉ số R 2 hay RV. Quá<br />

trình này sẽ dừng lại khi RV không tăng thêm với một tỷ lệ phần trăm cho trước nào đó<br />

so với RV của bước trước đó. Tỷ lệ này được gọi là tỷ lệ dừng, đóng vai trò quan trọng<br />

quyết định tới số lượng nhân tố dự báo. Nếu tỷ lệ dừng quá nhỏ, hiện tượng quá khớp<br />

(overfitting) có thể xảy ra. Mặc dù RV xác định từ tập số liệu phụ thuộc có giá trị lớn<br />

nhưng RV xác định từ tập số liệu độc lập sẽ có giá trị nhỏ, thậm chí âm. Nếu tử lệ dừng<br />

quá lớn, một số thông tin dự báo quan trọng sẽ không dược đưa vào phương trình dự<br />

báo và RV sẽ có giá trị nhỏ. Để xác định tỷ lệ dừng tối ưu, ta sẽ hiển thị đồng thời giá<br />

trị RV tính từ tập số liệu phụ thuộc và tập số liệu độc lập dựa theo các tỷ lệ dừng khác<br />

nhau như trên hình 5.2. Có thể thấy RV xác định trên tập số liệu phụ thuộc tăng dần<br />

khi tỷ lệ dừng giảm dần nhưng RV xác định trên tập số liệu độc lập bắt đầu giảm khi tỷ<br />

lệ dừng vượt quá 2% với MLR và 7% với ANN. Tỷ lệ dừng 2% và 7% do đó có thể<br />

xem là tỷ lệ dừng tối ưu trong những trường hợp này. Như vậy không có một tỷ lệ<br />

dừng duy nhất tối ưu cho mọi yếu tố dự báo và mọi phương pháp.<br />

Chỉ số RV được định nghĩa trong phương pháp hồi quy tuyến tính. Khi sử dụng<br />

cho mô hình ANN, cần phải hiểu RV như là bình phương của hệ số tương quan giữa<br />

yếu tố dự báo bởi mô hình với quan trắc thực của yếu tố dự báo. Riêng với các yếu tố<br />

hiện tượng, ta không sử dụng chỉ số RV khi tuyển chọn mà sử dụng chỉ số BSS. Ví dụ<br />

về biến thiên của BSS trong quá trình tuyển chọn nhân tố được cho trên hình 5.3. Chi<br />

tiết về dạng toán học của các chỉ số RV và BSS đã được trình bày trong chương 2.<br />

Khác với cách tiếp cận downscaling thống kê, dự báo sự hoạt động của bão được<br />

thực hiện theo phương pháp thống kê truyền thống. Do đó nhân tố dự báo được sử<br />

dụng 2 nhóm nhân tố là: Nhóm các chỉ số khí hậu và Nhóm chỉ số hoàn lưu (bảng 5.1).<br />

201

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!