Bài 10. Phương sai và độ lệch chuẩn

H24
H24
Hướng dẫn giải Thảo luận (1)

a) Không thể tính được chính xác phương sai và độ lệch chuẩn của mẫu số liệu gốc.

b) Tính phương sai và độ lệch chuẩn thông qua số liệu của mẫu số liệu ghép nhóm như sau:

+ Tìm \({y_1},{y_2},{y_3},{y_4},{y_5}\) lần lượt là giá trị đại diện của các nhóm \(\left[ {52;52,1} \right)\), \(\left[ {52,1;52,2} \right)\), \(\left[ {52,2;52,3} \right)\), \(\left[ {52,3;52,4} \right)\), \(\left[ {52,4;52,5} \right)\).

+ Tính số trung bình cộng \(\overline y \) của mẫu số liệu ghép nhóm đó.

+ Tính phương sai: \({s^2} = \frac{{1.{{\left( {{y_1} - \overline y } \right)}^2} + 5{{\left( {{y_2} - \overline y } \right)}^2} + 8{{\left( {{y_3} - \overline y } \right)}^2} + 4{{\left( {{y_4} - \overline y } \right)}^2} + 2{{\left( {{y_5} - \overline y } \right)}^2}}}{{20}}\)

+ Tính độ lệch chuẩn: \(s = \sqrt {{s^2}} \).

Khi đó, phương sai và độ lệch chuẩn của mẫu số liệu gốc lần lượt xấp xỉ với các giá trị \({s^2}\) và s.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

Chọn giá trị đại diện cho mẫu số liệu ta có:

Thời gian (giây)

[10,2; 10,4)

[10,4; 10,6)

[10,6; 10,8)

[10,8; 11)

Giá trị đại diện

10,3

10,5

10,7

10,9

Số vận động viên

3

7

8

2

Tổng số vận động viên là: \(3 + 7 + 8 + 2 = 20\)

Thời gian chạy trung bình của các vận động viên là: \(\overline x  = \frac{1}{{20}}\left( {10,3.3 + 10,5.7 + 10,7.8 + 10,9.2} \right) = 10,59\) (giây)

Phương sai của mẫu số liệu là:

\({s^2} = \frac{1}{{20}}\left( {10,{3^2}.3 + 10,{5^2}.7 + 10,{7^2}.8 + 10,{9^2}.2} \right) - 10,{59^2} = 0,0299\)

Độ lệch chuẩn của mẫu số liệu là: \(\sqrt {0,0299}  \approx 0,17\)

Phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm là các xấp xỉ cho phương sai, độ lệch chuẩn của mẫu số liệu gốc. Do đó, với mẫu số liệu gốc, phương sai xấp xỉ 0,0299 và độ lệch chuẩn xấp xỉ 0,17 giây.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

Chọn giá trị đại diện cho các nhóm số liệu, ta có:

Độ ẩm (%)

[52; 52,1)

[52,1; 52,2)

[52,2; 52,3)

[52,3; 52,4)

[52,4; 52,5)

Giá trị đại diện

52,05

52,15

52,25

52,35

52,45

Tần số

1

5

8

4

2

Độ ẩm trung bình trong 20 lần đo là: \(\overline x  = \frac{1}{{20}}\left( {52,05.1 + 52,15.5 + 52,25.8 + 52,35.4 + 52,45.2} \right) = 52,255\)

Phương sai của mẫu số liệu ghép nhóm là:

\({s^2} = \frac{1}{{20}}\left( {52,{{05}^2}.1 + 52,{{15}^2}.5 + 52,{{25}^2}.8 + 52,{{35}^2}.4 + 52,{{45}^2}.2} \right) - 52,{255^2} = 0,010475\)

Độ lệch chuẩn của mẫu số liệu là: \(s = \sqrt {0,010475}  \approx 0,102\)

Vì \(0,102 < 0,15\) nên không cần đưa máy đo này đi sửa chữa.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

a) Hoàn thành bảng:

Nhóm số liệu

[48,5; 49)

[49; 49,5)

[49,5; 50)

[50; 50,5)

[50,5; 51)

[51; 51,5)

Số bao xi măng

6

2

4

4

6

8

b) Với mẫu số liệu gốc:

+ Giá trị trung bình là: \(\overline x  = (49,5 + 48,9 + 51,4 + 51,1 + 49,3 + 48,7 + 50,8 + 50,7 + 51,2 + \)

\( + 50,2 + 48,8 + 50,6 + 48,7 + 49,8 + 50,9 + 49,6 + 48,8 + 49,2 + 51,3 + 51,2 + 50,7 + 51,4 + \)

\( + 50,4 + 51,1 + 50,1 + 50,0 + 48,6 + 50,5 + 51,2 + 49,6).\frac{1}{{30}} = \frac{{15043}}{{300}}\)

+ Phương sai: 

Tổng bình phương độ lệch: \(\frac{{78461}}{{3000}}\)

Phương sai: \({s^2} = \frac{1}{{30}}.\frac{{78461}}{{3000}} = \frac{{78461}}{{90000}}\)

Độ lệch chuẩn: \[s = \sqrt {{s^2}}  = \frac{{\sqrt {78461} }}{{300}} \approx 0,934\]

Theo mẫu số liệu ghép nhóm:

Ta có bảng số liệu với giá trị đại diện:

Nhóm số liệu

[48,5; 49)

[49; 49,5)

[49,5; 50)

[50; 50,5)

[50,5; 51)

[51; 51,5)

Giá trị đại diện

48,75

49,25

49,75

50,25

50,75

51,25

Số bao xi măng

6

2

4

4

6

8

Giá trị trung bình: \(\overline x  = \frac{{48,75.6 + 49,25.2 + 49,75.4 + 50,25.4 + 50,75.6 + 51,25.8}}{{30}} = \frac{{3011}}{{60}}\)

Phương sai:

\({s^2} = \frac{1}{{30}}\left( {48,{{75}^2}.6 + 49,{{25}^2}.2 + 49,{{75}^2}.4 + 50,{{25}^2}.4 + 50,{{75}^2}.6 + 51,{{25}^2}.8} \right) - {\left( {\frac{{3011}}{{60}}} \right)^2} = \frac{{194}}{{225}}\)

Độ lệch chuẩn: \(s = \sqrt {{s^2}}  \approx 0,929\)

Giá trị tính từ mẫu số liệu gốc là chính xác, giá trị tính từ mẫu số liệu ghép nhóm là giá trị xấp xỉ.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

Ta có bảng số liệu với giá trị đại diện:

Tuổi thọ (năm)

[1,5; 2)

[2; 2,5)

[2,5; 3)

[3; 3,5)

[3,5; 4)

Giá trị đại diện

1,75

2,25

2,75

3,25

3,75

Số linh kiện của phân xưởng 1

4

9

13

8

6

Số linh kiện của phân xưởng 2

2

8

20

7

3

Phân xưởng 1: Tổng số linh kiện: \(4 + 9 + 13 + 8 + 6 = 40\)

Giá trị trung bình \(\overline {{x_1}}  = \frac{{1,75.4 + 2,25.9 + 2,75.13 + 3,25.8 + 3,75.6}}{{4 + 9 + 13 + 8 + 6}} = \frac{{223}}{{80}}\)

Phương sai: \(s_1^2 = \frac{1}{{40}}\left( {1,{{75}^2}.4 + 2,{{25}^2}.9 + 2,{{75}^2}.13 + 3,{{25}^2}.8 + 3,{{75}^2}.6} \right) - {\left( {\frac{{223}}{{80}}} \right)^2} = \frac{{2271}}{{6400}}\)

Độ lệch chuẩn: \({s_1} = \sqrt {\frac{{2271}}{{6400}}}  \approx 0,6\)

Phân xưởng 2: Tổng số linh kiện: \(2 + 8 + 20 + 7 + 3 = 40\)

Giá trị trung bình \(\overline {{x_2}}  = \frac{{1,75.2 + 2,25.8 + 2,75.20 + 3,25.7 + 3,75.3}}{{2 + 8 + 20 + 7 + 3}} = \frac{{221}}{{80}}\)

Phương sai: \(s_2^2 = \frac{1}{{40}}\left( {1,{{75}^2}.2 + 2,{{25}^2}.8 + 2,{{75}^2}.20 + 3,{{25}^2}.7 + 3,{{75}^2}.3} \right) - {\left( {\frac{{221}}{{80}}} \right)^2} = \frac{{1399}}{{6400}}\)

Độ lệch chuẩn: \({s_2} = \sqrt {\frac{{1399}}{{6400}}}  \approx 0,47\)

Vì \(0,6 > 0,47\) nên độ phân tán của phân xưởng 1 lớn hơn độ phân tán của phân xưởng 2.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

a) Mẫu số liệu ghép nhóm với giá trị đại diện: 

Kết quả đo (μm)

[4,5; 5)

[5; 5,5)

[5,5; 6)

[6; 6,5)

Giá trị đại diện

4,75

5,25

5,75

6,25

Số học sinh

3

8

7

2

Số trung bình: \(\overline x  = \frac{{4,75.3 + 5,25.8 + 5,75.7 + 6,25.2}}{{20}} = \frac{{109}}{{20}}\left( {\mu m} \right)\)

Phương sai: \({s^2} = \frac{1}{{20}}\left( {4,{{75}^2}.3 + 5,{{25}^2}.8 + 5,{{75}^2}.7 + 6,{{25}^2}.2} \right) - {\left( {\frac{{109}}{{20}}} \right)^2} = \frac{{37}}{{200}}\)

Độ lệch chuẩn: \(s = \sqrt {\frac{{37}}{{200}}}  \approx 0,43\)

b) Số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm xấp xỉ với số trung bình và độ lệch chuẩn của mẫu số liệu gốc. Do đó, mẫu số liệu gốc có số trung bình xấp xỉ \(\frac{{109}}{{20}}\mu m\) và độ lệch chuẩn xấp xỉ 0,43\(\mu m\).

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

Ta có bảng số liệu với giá trị đại diện: 

Thời gian (giây)

[10; 10,3)

[10,3; 10,6)

[10,6; 10,9)

[10,9; 11,2)

Giá trị đại diện

10,15

10,45

10,75

11,05

Số lần chạy của A

2

10

5

3

Số lần chạy của B

3

7

9

6

Vận động viên A:

Giá trị trung bình \(\overline {{x_A}}  = \frac{{10,15.2 + 10,45.10 + 10,75.5 + 11,05.3}}{{2 + 10 + 5 + 3}} = \frac{{2117}}{{200}}\)

Phương sai: \(s_A^2 = \frac{1}{{20}}\left( {10,{{15}^2}.2 + 10,{{45}^2}.10 + 10,{{75}^2}.5 + 11,{{05}^2}.3} \right) - {\left( {\frac{{2117}}{{200}}} \right)^2} = \frac{{2691}}{{40000}}\)

Độ lệch chuẩn: \({s_A} = \sqrt {\frac{{2691}}{{40000}}}  \approx 0,26\)

Vận động viên B:

Giá trị trung bình \(\overline {{x_B}}  = \frac{{10,15.3 + 10,45.7 + 10,75.9 + 11,05.6}}{{3 + 7 + 9 + 6}} = \frac{{5333}}{{500}}\)

Phương sai: \(s_B^2 = \frac{1}{{25}}\left( {10,{{15}^2}.3 + 10,{{45}^2}.7 + 10,{{75}^2}.9 + 11,{{05}^2}.6} \right) - {\left( {\frac{{5333}}{{500}}} \right)^2} = \frac{{1296}}{{15625}}\)

Độ lệch chuẩn: \({s_B} = \sqrt {\frac{{1296}}{{15625}}}  = 0,288\)

Vì \({s_A} < {s_B}\) nên vận động viên A có thành tích luyện tập ổn định hơn.

Trả lời bởi datcoder
H24
Hướng dẫn giải Thảo luận (1)

a) Có nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán của học sinh hai trường vì 2 trường này có chất lượng tương đương nhau

b) Không nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán về doanh thu của 100 cửa hàng bán lẻ và 100 siêu thị vì doanh thu của 100 cửa hàng bán lẻ và 100 siêu thị là không gần tương đương nhau.

Trả lời bởi datcoder