Content text Chương 5_Bài 14_ _Đề bài.pdf
BÀI 14. CÁC SỐ ĐẶC TRƯNG. ĐO ĐỘ PHÂN TÁN A. KIẾN THỨC CƠ BẢN CẦN NẮM 1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ Khoảng biến thiên, kí hiệu là R, là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất trong mẫu số liệu. Ý nghĩa. Khoảng biến thiên dùng để đo độ phân tán của mẫu số liệu. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán. Tổ 1: 7 8 8 9 8 8 8 Tổ 2: 10 6 8 9 9 7 8 7 8. a) Điểm kiểm tra trung bình của hai tổ có như nhau không? b) Tính các khoảng biến thiên của hai mẫu số liệu. Căn cứ trên chỉ số này, các bạn tổ nào học đồng đều hơn? Giải a) Điểm kiểm tra trung bình của hai tổ đều bằng 8. b) Đối với Tổ 1: Điểm kiểm tra thấp nhất, cao nhất tương ứng là 7;9. Do đó, khoảng biến thiên là: 1 R = - = 9 7 2 . Đối với Tổ 2: Điểm kiểm tra thấp nhất, cao nhất tương ứng là 6;10. Do đó, khoảng biến thiên là: 2 R = - = 10 6 4 . Do R R 2 1 > nên ta nói các bạn Tổ 1 học đều hơn các bạn Tổ 2. Mẫu số liệu sau cho biết chiều cao (đơn vị cm) của các bạn trong tổ: 163 159 172 167 165 168 170 161 Tính khoảng biến thiên của mẫu số liệu này. Giải Chiều cao thấp nhất, cao nhất tương ứng là 159; 172. Do đó, khoảng biến thiên là: R 172 159 13 = - = . Nhận xét. Sử dụng khoảng biến thiên có ưu điểm là đơn giản, dễ tính toán song khoảng biến thiên chỉ sử dụng thông tin của giá trị lớn nhất và giá trị nhỏ nhất mà bỏ qua thông tin từ tất cả các giá trị khác. Do đó, khoảng biến thiên rất dễ bị ảnh hưởng bởi các giá trị bất thường. Khoảng tứ phân vị, kí hiệu DQ , là hiệu số giữa tứ phân vị thứ ba và tứ phân vị thứ nhất, túc là: D = - Q Q Q 3 1 Ví dụ 1. Điểm kiểm tra học kì môn Toán của các bạn Tổ 1, Tổ 2 lớp 10A được cho như sau: Luyện tập 1.
Ý nghĩa. Khoảng tứ phân vị cũng là một số đo độ phân tán của mẫu số liệu. Khoảng tứ phân vị càng lớn thì mẫu số liệu càng phân tán. Chú ý. Một số tài liệu gọi khoảng biến thiên là biên độ và khoảng tứ phân vị là độ trải giữa. 7 8 22 20 15 18 19 13 11. Tìm khoảng tứ phân vị cho mẫu số liệu này. Giải Trước hết, ta sắp xếp mẫu số liệu theo thứ tự không giảm: 7 8 11 13 15 18 19 20 22. Mẫu số liệu gồm 9 giá trị nên trung vị là số ở vị trí chính giữa 2 Q = 15 . Nửa số liệu bên trái là 7, 8, 11, 13 gồm 4 giá trị, hai phần tử chính giữa là 8, 11. Do đó, 1 Q = + = (8 11) : 2 9,5 . Nửa số liệu bên phải là 18, 19, 20, 22 gồm 4 giá trị, hai phần tử chính giữa là 19, 20. Do đó, 3 Q = + = (19 20) : 2 19,5 . Vậy khoảng tứ phân vị cho mẫu số liệu là: 19,5 9,5 10 D = - = Q . 2. Phương sai và độ lệch chuẩn Khoảng biến thiên chỉ sử dụng thông tin của giá trị lớn nhất và nhỏ nhất của mẫu số liệu (bỏ qua thông tin của tất cả các giá trị khác), còn khoảng tứ phân vị chỉ sử dụng thông tin của 50% số liệu chính giữa. Có một vài số đặc trưng khác đo độ phân tán sử dụng thông tin của tất cả các giá trị trong mẫu số liệu. Hai trong số đó là phương sai và độ lệch chuẩn. Cụ thể là với mẫu số liệu 1 2 n x ,x ,...,x , nếu gọi số trung bình là x thì với mỗi giá trị i x , độ lệch của nó so với giá trị trung bình là i x x - . a)Phương sai: Kí hiệu 2 x s Trường hợp bảng phân bố tần số, tần suất 2 2 2 2 1 1 2 2 1 ( ) ( ) ... ( ) x k k s n x x n x x n x x n = - + - + + - é ù ë û 2 2 2 1 1 2 2 ( ) ( ) ... ( ) . k k = - + - + + - f x x f x x f x x Ví dụ 2. Mẫu số liệu sau cho biết số ghế trống tại một rạp chiếu phim trong 9 ngày:
Trường hợp bảng phân bố tần số, tần suất ghép lớp 2 2 2 2 1 1 2 2 1 ( ) ( ) ... ( ) x k k s n c x n c x n c x n = - + - + + - é ù ë û 2 2 2 1 1 2 2 ( ) ( ) ... ( ) . k k = - + - + + - f c x f c x f c x Trong đó , , i i i n f c lần lượt là tần số, tần suất, giái trị đại diện của lớp thứ i; n là số các số liệu thống kê; x là số trung bình cộng của các số liệu thống kê đã cho Chú ý: Có thể tính theo công thức sau: 2 2 2 x s x x = - Trong đó 2 x = 2 2 2 2 2 2 1 1 2 2 1 1 2 2 1 ... ... k k k k n x n x n x f x f x f x n é ù + + + = + + + ë û (đối với bảng phân bố tần số, tần suất) hoặc 2 x = 2 2 2 2 2 2 1 1 2 2 1 1 2 2 1 ... ... k k k k n c n c n c f c f c f c n é ù + + + = + + + ë û (đối với bảng phân bố tần số, tần suất ghép lớp) Ý nghĩa phương sai Phương sai được sử dụng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình). Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình bằng nhau hoặc xấp xỉ nhau, dãy có phương sai càng nhỏ thì mức độ phân tán (so với số trung bình) của các số liệu thống kê càng bé. b) Độ lệch chuẩn: Khi chú ý đơn vị đo ta thấy phương sai 2 x s có đơn vị đo là bình phương của đơn vị đo được nghiên cứu ( đơn vị đo nghiên cứu là cm thì 2 x s là 2 cm ), để tránh tình trạng này ta dùng căn bậc hai của phương sai gọi là độ lệch chuẩn. Độ lệch chuẩn, kí hiệu là x s 2 x x s s = Ý nghĩa độ lệch chuẩn: Độ lệch chuẩn cũng dùng đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình). Khi cần chú ý đến đơn vị đo ta dùng độ lệch chuẩn để đánh giá vì độ lệch chuẩn có cùng đơn vị đó với dấu hiệu X được nghiên cứu. Chú ý. Người ta còn sử dụng đại lượng để đo độ phân tán của mẫu số liệu:
2 2 2 2 1 2 n x x x x ... x x s n 1 - + - + + - = - $ . Ý nghĩa. Nếu số liệu càng phân tán thì phương sai và độ lệch chuẩn càng lớn. 43 45 46 41 40 Tìm phương sai và độ lệch chuẩn cho mẫu số liệu này. Giải Số trung bình của mẫu số liệu là 43 45 46 41 40 x 43. 5 + + + + = = Ta có bảng sau: Giá trị Độ lệch Bình phương độ lệch 43 43 – 43 = 0 0 45 45 – 43 = 2 4 46 46 – 43 = 3 9 41 41 – 43 = - 2 4 10 40 – 43 = - 3 9 Tổng 26 Mẫu số liệu gồm 5 giá trị nên n 5 = . Do đó phương sai là 2 26 s 5,2. 5 = = Độ lệch chuẩn là: s 5,2 2,28. = » 3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP Trong mẫu số liệu thống kê, có khi gặp những giá trị quá lớn hoặc quá nhỏ so với đa số các giá trị khác. Những giá trị này được gọi là giá trị bất thường. Chúng xuất hiện trong mẫu số liệu có thể do nhầm lẫn hay sai sót nào đó. Ta có thể dùng biểu đồ hộp để phát hiện những giá trị bất thường này. Các giá trị lớn hơn 3 1,5. Q + DQ hoặc bé hơn 1 1,5. Q - DQ được xem là giá trị bất thường. Ví dụ: Hàm lượng Natri (đơn vị mg) trong 100 g một số loại ngũ cốc được cho như sau: Ví dụ 3. Mẫu số liệu sau đây cho biết sĩ số của 5 lớp khối 10 tại một trường Trung học: