11.07.2017 Views

Báo cáo bài tập lớn môn xác suất thống kê GVHD Nguyễn Đình Huy

LINK DOCS.GOOGLE: https://drive.google.com/file/d/0B_NNtKpVZTUYVDc1SVRHTDROdTA/view?usp=sharing

LINK DOCS.GOOGLE:
https://drive.google.com/file/d/0B_NNtKpVZTUYVDc1SVRHTDROdTA/view?usp=sharing

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH<br />

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM<br />

--oOo--<br />

BÁO CÁO BÀI TẬP LỚN MÔN<br />

XÁC SUẤT THỐNG KÊ<br />

<strong>GVHD</strong>: <strong>Nguyễn</strong> <strong>Đình</strong> <strong>Huy</strong><br />

SVTH:<br />

MSSV:<br />

Nhóm : 8<br />

TP HỒ CHÍ MINH - 8/2012


BÀI SỐ 8<br />

1. Trình bày lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 Sách BT XSTK 2012<br />

(N.Đ.HUY).<br />

Ví dụ 3.4 trang 207 sách BT<br />

Hiệu <strong>suất</strong> phần trăm (%) của một phản ứng hoá học được nghiên cứu theo ba yếu tố pH<br />

(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:<br />

Yếu tố<br />

A<br />

Yếu tố B<br />

B1 B2 B3 B4<br />

A1 C1 9 C2 14 C3 16 C4 12<br />

A2 C2 12 C3 15 C4 12 C1 10<br />

A3 C3 13 C4 14 C1 11 C2 14<br />

A4 C4 10 C1 11 C2 13 C3 13<br />

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu <strong>suất</strong> phản ứng?<br />

• Dạng toán:<br />

Phân tích phương sai ba yếu tố<br />

• Cơ sở lý thuyết:<br />

Giải<br />

Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị<br />

quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2... r: yếu tố B; k = 1, 2... r: yếu tố C)<br />

• Mô hình:<br />

Khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô<br />

hình vuông latinh n*n. Ví dụ như mô hình vuông latinh 4*4:<br />

B C D A<br />

C D A B<br />

D A B C<br />

A B C D<br />

Mô hình vuông latinh 3 yếu tố được trình bày như sau:<br />

Yếu tố C (T..k. ví dụ: T...1 = Y111 + Y421 + Y331 + Y241)


Trắc nghiệm<br />

Giả thiết:<br />

H 0 : µ 1 = µ 2 = ….= µ k Các giá trị trung bình bằng nhau<br />

H 1 : µ j ≠ µ k Có ít nhất hai giá trị trung bình khác nhau<br />

Giá trị <strong>thống</strong> <strong>kê</strong>: và <br />

Biện luận:<br />

- Nếu nhận H 0 (yếu tố A)<br />

- Nếu (chấp nhận H 0 (yếu tố B))<br />

- Nếu (chấp nhận H 0 (yếu tố C))<br />

Áp dụng MS-EXCEL:<br />

Thiết lập bảng tính như sau:<br />

Tính các giá trị Ti..(tổng theo hàng từ B đến E)


Chọn ô B7 và nhập biểu thức =SUM(B2:E2)<br />

Chọn ô C7 và nhập biểu thức =SUM(B3:E3)<br />

Chọn ô D7 và nhập biểu thức =SUM(B4:E4)<br />

Chọn ô E7 và nhập biểu thức =SUM(B5:E5)<br />

Tính các giá trị T.j.(tổng theo cột từ hàng thứ 2 đến hàng thứ 5)<br />

Chọn ô B8 và nhập biểu thức =SUM(B2:B5)<br />

Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8<br />

Tính các giá trị T..k<br />

Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)<br />

Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)<br />

Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)<br />

Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)<br />

Tính giá trị T..(tổng các phẩn tử trong bảng)<br />

Chọn ô B10 và nhập biểu thức =SUM(B2:E5)<br />

Tính các giá trị và <br />

Các giá trị và <br />

Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)<br />

Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9<br />

Giá trị <br />

Chọn ô G10 và nhập biểu thức =POWER(B10,2)<br />

Giá trị <br />

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)<br />

Tính các giá trị SSR,SSC,SSF,SST và SSE<br />

Các giá trị SSR,SSC và SSF<br />

Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)<br />

Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9<br />

Giá trị SST<br />

Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)<br />

Giá trị SSE<br />

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)<br />

Tính các giá trị MSR,MSC,MSF và MSE<br />

Các giá trị MSR,MSC và MSF<br />

Giá trị SST<br />

Chọn ô K7 và nhập biểu thức =I7/(4-1)<br />

Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9<br />

Giá trị MSE


Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))<br />

Tính các giá trị và F<br />

Chọn ô M7 và nhập biểu thức =K7/0.3958<br />

Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9<br />

Kết luận và Biện luận:<br />

• F R =3.10 < F 0.05 (3.6)= 4.76 =>chấp nhận H 0 (pH)<br />

• F C =11.95> F 0.05 (3.6) = 4.76 =>bác bỏ H 0 (nhiệt độ)<br />

• F =30.05 > F 0.05 (3.6) = 4.76 => bác bỏ H 0 (chất xúc tác)<br />

Kết luận:<br />

Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu <strong>suất</strong>.<br />

VÍ DỤ 4.2<br />

Người ta đã dùng 3 mức nhiệt độ gồm 105, 120, 135 o C kết hợp với 3 khoảng thời<br />

gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp. các hiệu <strong>suất</strong> phản ứng(%)<br />

được trình bày trong bảng sau:<br />

Thời gian(ph)<br />

X1<br />

nhiệt độ( độ C)<br />

X2<br />

hiệu <strong>suất</strong> %<br />

15 105 1.87<br />

30 105 2.02<br />

60 105 3.28<br />

15 120 3.05<br />

30 120 4.07<br />

60 120 5.54<br />

15 135 5.03<br />

30 135 6.45<br />

60 135 7.26<br />

Y<br />

Hãy cho biết yếu tố nhiệt độ và thời gian / hoặc yếu tố thời gian có liên quan tuyến<br />

tính với hiệu <strong>suất</strong> của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 150 0 C trong vòng<br />

50 phút thì hiệu <strong>suất</strong> phản ứng là bao nhiêu?<br />

Áp dụng MS EXCEL<br />

Nhập dữ liệu vào bảng tính ta được như sau:<br />

Giải


Sử dụng chương trình “ Regression” trong thẻ Data => Data Analysis<br />

Chọn OK hộp thoại Regression xuất hiện<br />

Trong hộp Regression,lần lượt ấn định các chi tiết<br />

- Phạm vi của biến số Y (Input Y Range)<br />

- Phạm vi của biến số X (Input Y Range)<br />

- Nhãn dữ liệu (Labels)<br />

- Mức tin cậy (Confidence Level)<br />

- Tọa độ đầu ra (Output Range)<br />

- Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức<br />

sai số (Residuals Plots)…..<br />

1. Phương trình hồi quy tương ứng X 1<br />

Kiểm định giả thiết H o : thời gian không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />

phản ứng tổng hợp


Phương trình hồi quy<br />

Yx 1 = f ( x1)<br />

Yx 1 = 2.73 + 0.04x1<br />

(R 2 =0.21 ; S=1.81) (1)<br />

Ta có t o = 2.12903 < t 0.05 = 2.365 (P v 2 = 0.0708 > a = 0.05)<br />

⇒ chấp nhận giả thiết H o<br />

t 1 = 1.3802 < t 0.05 = 2.365 (P v = 0.2099 > a = 0.05) (Tra bảng STUDENT)<br />

⇒ chấp nhận giả thiết H o<br />

F = 1.905 < F 0.05 (1,7) = 5.590 (hay F s = 0.209 > a = 0.05) (Tra bảng FISHER)<br />

⇒ chấp nhận giả thiết H o<br />

Vậy cả 2 hệ số 2.73(B 0 ) và 0.04(B 4 ) của phương trình hồi quy (1) đều không có ý nghĩa


<strong>thống</strong> <strong>kê</strong>. Do vậy phương trình hồi quy này không thích hợp.<br />

Kết luận: Vậy yếu tố thời gian không liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng<br />

tổng hợp.<br />

2. Phương trình hồi quy tương ứng X 2<br />

Kiểm định giả thiết H o : nhiệt độ không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />

phản ứng tổng hợp.<br />

Ta có kết quả:


Phương trình hồi quy<br />

Yx 2 = f ( x2)<br />

Yx 2 = − 11.141+<br />

0.1286x2<br />

(R 2 = 0.76 : S = 0.99) (2)<br />

Ta có t o =3.418 > t 0.05 = 2.365 (P v 2 = 0.0111< a = 0.05)<br />

⇒ bác bỏ giả H o<br />

t 2 = 4.757> t 0.05 = 2.365 (P v = 0.0021< a = 0.05) (Tra bảng STUDENT)<br />

⇒ bác bỏ giả thiết H o<br />

F= 22.631>F 0.05 (1,7) = 5.59 (F s =0.0021< a = 0.05) (Tra bảng FISHER)<br />

⇒ bác bỏ giả thiết H 0<br />

Ta cũng kết luận: Hai hệ số -11.141(B 0 ) và 0.1286(B 2 ) của phương trình hồi quy(2)<br />

đều có ý nghã <strong>thống</strong> <strong>kê</strong>. Hay nói phương trình hồi quy này phù hợp<br />

Vậy yếu tố nhiệt độ liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng tổng hợp.<br />

3. Phương trình hồi quy tương ứng X 1 ,X 2<br />

Kiểm định giả thiết H o : thời gian và nhiệt độ không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />

phản ứng tổng hợp


Phương trình hồi quy<br />

Yx 1, x2 = f ( x1, x2)<br />

(R 2 = 0.9776 ; S = 0.3297) (3)<br />

Yx 1, x2 = − 12.70 + 0.04x1 + 0.1286x2<br />

Ta có t o = 11.528 > t 0.05 = 2.365 ( P v = 2.56x10^-5 < a = 0.05)<br />

⇒ bác bỏ giả thiết H 0<br />

t 1 = 7.5827> t 0.05 = 2.365 (P v =0.00027 < a = 0.05)<br />

⇒ bác bỏ giả thiết Ho<br />

t 2 = 14.3278 > t 0.05 = 2.365 (P v = 7.234x10^-6< a = 0.05) (Tra bảng STUDENT)<br />

⇒ bác bỏ giả thiết H 0<br />

F= 131.392 >F 0.05 (2,6) = 5.140 ( hay F s =1.112x10^-5 < a = 0.05) (Tra bảng FISHER)<br />

⇒ bác bỏ giả thiết H 0<br />

Vậy các hệ số -12.7(B 0 ) , 0.04(B 1 ) và 0.1286(B 0 ) của phương trình hồi quy (3) đều có ý<br />

nghĩa <strong>thống</strong> <strong>kê</strong>. Vậy phương trình này là phù hợp.<br />

Kết luận: thời gian và nhiệt độ có liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng tổng<br />

hợp.<br />

Sự tuyến tính của phương trình Yx 1, x2 = − 12.70 + 0.04x1 + 0.1286x2<br />

Dự đoán hiệu <strong>suất</strong> phản ứng bằng phương trình hồi quy (3) ta làm như sau.<br />

Hiệu <strong>suất</strong> dự đoán = B 0 + B 1 *50 + B 2 *115<br />

Với B 0 , B 1, B 2 là hệ số phương trình hồi quy (3)


Kết quả thu được như sau:<br />

Coefficients<br />

Standard<br />

Error<br />

t Stat<br />

Intercept -12.7 1.101639 -11.5283<br />

X1 0.04454 0.005874 7.582718<br />

X2 0.128556 0.008972 14.32782<br />

Dự đoán 4.310873<br />

BÀI 2<br />

2. Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau:<br />

X 2,3 2,5 2,6 3,1 3,4 3,7 7,3<br />

Y 7 8 4 4 6 6 14<br />

X 3,9 4 4,1 4,1 4,2 4,4<br />

Y 12 8 5 7 8 7<br />

X 4,7 5,1 5,5 5,8 6,2 6,9 6,9<br />

Y 9 10 13 7 11 11 16<br />

a) Tìm đường hồi quy của Y đối với X.<br />

b) Tính sai số tiêu chuẩn của đường hồi quy.<br />

c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X.<br />

tuyến tính<br />

Giả thiết :<br />

Nhận xét :Đây là <strong>bài</strong> toán phân tích hồi quy<br />

H 0 : βi = 0 “Phương trình hồi quy không thích hợp”<br />

H 0 : βi ≠ 0 “Phương trình hồi quy thích hợp”<br />

Giá trị <strong>thống</strong> <strong>kê</strong>:<br />

F =<br />

MSF<br />

MSE<br />

Phân bố Fisher v1 = 1, v2 = N-2<br />

Kết luận<br />

Nếu F < Fα (1,N-2) => Chấp nhận giả thiết H 0


Thực hiện <strong>bài</strong> toán bằng Excel<br />

Thiết lập bảng tính Regression:<br />

Nhập dữ liệu vào bảng tính :<br />

Sau đó vào Data /Data analysis, chọn Regression.<br />

Trong hộp thoại Regression lần lượt ấn định:<br />

• Phạm vi đầu vào: Input Y Range, quét vùng(B3:B23).<br />

Input X Range, quét vùng(A3:A23).<br />

• Chọn Labels (thêm nhãn dữ liệu).<br />

• Phạm vi đầura: Output Range, chọn ô D3.<br />

• Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.<br />

Sau đó nhấn OK ta có kết quả :


Kết luận :<br />

Đường hồi quy của Y đốivới X là : Y=1.67689X+1.045276<br />

X Line Fit Plot<br />

Y<br />

Y<br />

Predicted Y<br />

X<br />

Sai số tiêu chuẩn của đường hồi quy : 2,22<br />

Ta thấy: F = 24,3 > c = 4,41<br />

(tra bảng phân tố Fisher với bậc tự do (1,18) ở mức 0,05)<br />

Vậy: có hồi quy tuyến tính giữa Y với X.<br />

Có hồi quy tuyến tính giữa đường kính và chiều cao<br />

BÀI 3<br />

Một công ty muốn mở rộng việc bán sản phẩm sang 3 thị trường nước ngoài. Để<br />

đánh giá xem thị phần mà công ty có thể chiếm lĩnh được tại ba thị trường đó so với<br />

các đối thủ cạnh tranh có khác nhau hay không người ta đã thủ nghiệm thị trường<br />

bằng cách bán thử sản phẩm cho 150 khách hàng tiềm năng tại mỗi thị trường và thu<br />

được kết quả sau:


Thị trường<br />

A B C<br />

Công ty 55 38 24<br />

Đối thủ cạnh tranh 1 28 30 21<br />

Đối thủ cạnh tranh 2 20 18 31<br />

Các đối thủ khác 47 64 74<br />

Hãy tìm P-value để kiểm định xem cơ cấu của ba thị trường trên có khác nhau<br />

hay không.<br />

CƠ SỞ LÍ THUYẾT: Dạng <strong>bài</strong> so sánh tỷ số đơn giản.<br />

Giả thiết:<br />

H 0 : P 1 =P 1,0 ; P 2= P 2,0 ;….; P k,0 các cặp P i và P i,0 giống nhau.<br />

H 1 : có ít nhất một cặp P i và P i,0 khác nhau.<br />

Giá trị <strong>thống</strong> <strong>kê</strong><br />

2 <br />

=∑ <br />

<br />

O i : các tần số thực nghiệm.<br />

E i : các tần số lý thuyết.<br />

• Biện luận:<br />

χ 1 > χ 2 (a) bác bỏ giả thiết H o (DF=K-1)<br />

Trong Excel có hàm Chitest có thể tính giá trị χ 2 theo biểu thức:<br />

2 <br />

<br />

=∑ ∑<br />

ị ị <br />

ị<br />

O i j : các tần số thực nghiệm của ô thuộc hàng thứ I cột j.<br />

E i j<br />

<br />

: các tần số lý thuyết của ô thuộc hàng thứ I cột j; r là số hàng; c là số<br />

cột.<br />

• Xác <strong>suất</strong> P(X > 2 )<br />

với bậc tự do DF= (r-1) (c-1)<br />

Nếu P(X > )<br />

⇒ chấp nhận giả thiết H o và ngược lại.<br />

Nhập giá trị vào bảng tính:<br />

THỰC HIỆN BÀI TOÁN BẰNG EXCEL


Tính tổng các số:<br />

• Tổng hàng: Chọn F3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút tự<br />

điều khiển từ điền từ F3 đến F6.<br />

• Tổng cột: Chọn B8, nhập =SUM(B3:B6), rồi Enter, dùng con trỏ kéo nút tự<br />

điều khiển từ B8 đến D8.<br />

• Tổng cộng: chọn F8 và nhập =SUM(F3:F6) hay nhập =SUM(B8:D8)<br />

Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng<br />

• A: Chọn B12: nhập =F3*$B$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />

khiển từ B12 đến B15.<br />

• B: Chọn C12: nhập =F3*$C$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />

khiển từ C12 đến C15.<br />

• C: Chọn D12: nhập =F3*$D$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />

khiển từ D12 đến D15<br />

.


• Áp dụng hàm số CHITEST tính giá trị <br />

Chọn B17, nhập =CHITEST(B3:D6,B12:D15), rồi Enter<br />

Hoặc chọn Formulas → Insert Function → chitest → OK<br />

Xuất hiện hộp thoại Function Agruments<br />

• Nhập các giá trị tần số quan sát vào mục Actual_range<br />

• Nhập các giá trị tần số lí thuyết vào mục Expected_range. Chọn OK<br />

Ta được P = 0.00044854 0.05 nên bác bỏ giả thuyết .<br />

Kết luận: Như vậy cơ cấu 3 thị trường trên là không giống nhau<br />

BÀI 4<br />

4.Người ta tiến hành đo mực nước sông tại một số địa điểm thuộc tỉnh X trong cùng<br />

một ngày (số lần đo không giống nhau) và thu được bảng số liệu sau đây:<br />

Thời điểm<br />

đo<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

Địa điểm đo<br />

F1 F2 F3 F4<br />

5,5 4,9 4,6 4,5<br />

5,6 5,1 4,8 6,2<br />

5,8 6,5 5,8 4,8<br />

5,9 5,4 5,1 4,8<br />

6,0 6,1 6,2 6,5<br />

6,7<br />

7,1 6,8<br />

7,2<br />

Với mức ý nghĩa α = 2%.Mực nước sông trung bình/ngày của các điểm nói trên có<br />

thực sự khác nhau không?


BÀI GIẢI<br />

I.Cở sở lý thuyết:<br />

a.Dạng <strong>bài</strong> toán : Phân tích phương sai 1 yếu tố<br />

b.Khái niệm <strong>thống</strong> <strong>kê</strong> và giả thuyết <strong>bài</strong> toán:<br />

Sự phân tích phương sai 1 yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự<br />

nhiên) nào đó trên các giá trị quan sát , Y i ,(i=1,2,…,k)<br />

Yếu tố thí nghiệm<br />

1 2 … K<br />

Y 11<br />

Y 12<br />

…<br />

Y 1N<br />

Y 21<br />

Y 22<br />

…<br />

Y 2N<br />

…<br />

…<br />

…<br />

…<br />

Y k1<br />

Y k2<br />

…<br />

Y kN<br />

Tổng cộng<br />

Trung bình<br />

T .1<br />

Y<br />

.1<br />

T .2<br />

Y<br />

.2<br />

…<br />

…<br />

T k<br />

Y .<br />

Y<br />

T ..<br />

c<br />

..<br />

Bảng ANOVA<br />

Nguồn sai<br />

số<br />

Yếu tố<br />

Sai số<br />

Bậc tự<br />

do<br />

(k-1)<br />

N-k<br />

Tổng số bình phương<br />

SSF<br />

=<br />

k<br />

∑<br />

i=<br />

1<br />

T<br />

N<br />

2<br />

i<br />

T..<br />

−<br />

N<br />

2<br />

Bình phương<br />

trung bình<br />

SSF<br />

MSF =<br />

( k −1)<br />

SSE<br />

MSE =<br />

SSE = SST – SSF ( N − k)<br />

Giá trị<br />

<strong>thống</strong> <strong>kê</strong><br />

MSF<br />

F =<br />

MSE<br />

F C<br />

=<br />

MSF<br />

MSE<br />

Tổng cộng (N-1)<br />

SST<br />

=<br />

k<br />

N<br />

∑∑<br />

i= 1 j=<br />

1<br />

Y<br />

2<br />

ij<br />

T..<br />

−<br />

N<br />

2<br />

Trắc nghiệm<br />

Giả thiết:<br />

H 0 : µ<br />

1<br />

= µ<br />

2<br />

= ... µ<br />

k<br />

⇔ “ Các giá trị trung bình bằng nhau”<br />

H 1 : µ ≠ ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”<br />

i<br />

µ<br />

j<br />

Giá trị <strong>thống</strong> <strong>kê</strong>:<br />

MSF<br />

F =<br />

MSE<br />

Biện luận :<br />

Nếu F < Fa [ k −1,<br />

N − k]<br />

⇒ chấp nhận giả thiết H 0.


Ta gỉa thiết:<br />

Mực nước sông trung bình/ngày của các điểm đã đo là như nhau.<br />

Nhập bảng số liệu:<br />

THỰC HIỆN BÀI TOÁN BẰNG EXEL<br />

Nhấp vào lệnh Data va lệnh Data Analysis.<br />

Chọn chương trình Anova:Single Factor trong hộp thoại Data Analysis rồi nhấn OK.<br />

Trong hộp Anova:Single Factor lần lượt ấn định:<br />

Phạm vi đầu vào (Input Range):ta kéo từ B2 đến E9.<br />

Cách sắp xếp theo hàng hay cột (Group By):Chọn Columns.<br />

Nhấn dữ liệu (Labels in Fisrt row/column).<br />

Phạm vi đầu ra (Output Range):Chọn A12.


Được kết quả:<br />

Biện luận:<br />

F=0.598833 < F 0,02 =4.113404<br />

Chấp nhận giả thiết H 0 .<br />

Vậy mực nước sông trung bình của các điểm đã cho là như nhau<br />

BÀI 5<br />

5. Với mức ý nghĩa α = 5%. So sánh chi phí cho ba loại dịch vụ ở ba thành phố khác<br />

nhau bằng phương phương phân tích phương sai trên cơ sở bảng số liệu sau


đây:<br />

Thành phố<br />

I<br />

II<br />

III<br />

Loại dịch vụ<br />

I II III<br />

61<br />

58<br />

68<br />

52<br />

51<br />

64<br />

69<br />

61<br />

79<br />

Các con số trong ô là chi phí trung bình cho 1 lần dịch vụ (đơn vị: 1000đ)<br />

1. Cơ sở lý thuyết :<br />

a. Dạng <strong>bài</strong> toán : Phân tích phương sai 2 nhân tố không liên quan<br />

b. Khái niệm <strong>thống</strong> <strong>kê</strong> và giả thiết <strong>bài</strong> toán :<br />

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Y ij<br />

( i = 1.2…r : yếu tố A; j = 1.2…c : yếu tố B).<br />

Mô hình<br />

Yếu tố A<br />

1<br />

2<br />

…<br />

r<br />

Tổng cộng<br />

Trung bình<br />

1 2<br />

Yếu tố B<br />

… C Tổng cộng<br />

Y 11 Y 12 … Y 1c Y 1<br />

Y r1 … Y rc<br />

Y 21 Y 22 … Y 2c Y 2<br />

… … … … …<br />

T .1<br />

Y<br />

.1<br />

Y r2<br />

T .2<br />

Y<br />

.2<br />

…<br />

…<br />

T .c<br />

Y .<br />

Y<br />

T ..<br />

c<br />

Trung bình<br />

Y<br />

1<br />

Y<br />

2<br />

Y r<br />

..<br />

…<br />

Y<br />

r<br />

Bảng ANOVA<br />

Nguồn sai Bậc tự<br />

số do<br />

Yếu tố A (r-1)<br />

(hàng)<br />

Yếu tố B<br />

(cột)<br />

(c-1)<br />

Tổng số bình phương<br />

SSB =<br />

SSB =<br />

r<br />

∑<br />

i=<br />

1<br />

c<br />

∑<br />

j=<br />

1<br />

T<br />

T<br />

2<br />

i<br />

c<br />

2<br />

j<br />

r<br />

2<br />

T..<br />

−<br />

rc<br />

2<br />

T..<br />

−<br />

rc<br />

Bình phương<br />

trung bình<br />

SSB<br />

MSB =<br />

( r −1)<br />

MSF<br />

SSF<br />

=<br />

( c −1)<br />

Giá trị<br />

<strong>thống</strong> <strong>kê</strong><br />

MSB<br />

F R<br />

=<br />

MSE<br />

F C<br />

=<br />

MSF<br />

MSE<br />

Sai số (r-1)(c-1) SSE = SST – (SSF + SSB)<br />

Tổng cộng (rc-1)<br />

SST =<br />

r<br />

c<br />

∑∑<br />

i= 1 j=<br />

1<br />

Y<br />

2<br />

ij<br />

T..<br />

−<br />

r<br />

2<br />

SSB<br />

MSB =<br />

( r −1)


Trắc nghiệm<br />

• Giả thiết:<br />

H 0 : µ<br />

1<br />

= µ<br />

2<br />

= ... µ<br />

k<br />

⇔ “ Các giá trị trung bình bằng nhau”<br />

H 1 : µ ≠ ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”<br />

i<br />

µ<br />

j<br />

• Giá trị <strong>thống</strong> <strong>kê</strong>:<br />

MSB<br />

F R<br />

= và F C<br />

=<br />

MSE<br />

MSF<br />

MSE<br />

• Biện luận :<br />

Nếu FR < Fa<br />

[ b −1,(<br />

k −1)(<br />

b −1)]<br />

⇒ chấp nhận H 0 (yếu tố A)<br />

Nếu FC < Fa<br />

[ k −1,(<br />

k −1)(<br />

b −1)]<br />

⇒ chấp nhận H 0 (yếu tố B)<br />

2. Áp dụng MS Excel :<br />

a.Nhập các số liệu vào bảng<br />

b. Nhấp lần lượt Data tab và Data Analysis tab.<br />

c. Chọn chương trình Anova : Two-Factor Without Replication trong hộp thoại Data<br />

Analysis rồinhấp nút OK.<br />

d. Trong hộp thoại Anova: Single Factor lần lượt <strong>xác</strong> định:<br />

- Phạm vi đầu vào (Input Range)<br />

- Cách sắp xếp theo hàng hay cột (Group by)<br />

- Nhãn dữ liệu (Label in First Row/Column).<br />

- Phạm vi đầu ra (Output Range)


e. Được kết quả như sau :<br />

Biện luận :<br />

F R = 24,91589 > F 0,05 = 6.944272 → Bác bỏ giả thuyết H 0 ( Thành phố)<br />

F C = 24,7477 > F 0,05 = 6.944272 → Bác bỏ giả thuyết H 0 ( Loại dịch vụ)<br />

Vậy chi phí cho 3 loại dich vụ ở 3 thành phố khác nhau không chịu ảnh hưởng của thành<br />

phố hay loại dịch vụ nên chúng giống nhau

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!