Content text Chương 3_Bài 1_Khoảng biến thiên và tứ phân vị_Lời giải_Toán 12_CTST.pdf
CHƯƠNG III. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CỦA MẪU SỐ LIỆU GHÉP NHÓM BÀI 1. KHOẢNG BIẾN THIÊN KHOẢNG TỨ PHÂN VỊ CỦA MẪU SỐ LIỆU GHÉP NHÓM A. KIẾN THỨC CƠ BẢN CẦN NẮM 1. KHOẢNG BIẾN THIÊN Khoảng biến thiên, kí hiệu R , của mẫu số liệu ghép nhóm là hiệu số giữa đầu mút phải của nhóm cuối cùng và đầu mút trái của nhóm đầu tiên có chứa dữ liệu của mẫu số liệu. Chú ý: Xét mẫu số liệu ghép nhóm được cho ở bảng sau: Bảng 1 Nếu 1 n và k 1 n cùng khác 0 thì R k 1 1 u u . Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc. Khoảng biến thiên của mẫu số liệu ghép nhóm là giá trị xấp xỉ khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu. Khoảng biến thiên R k 1 1 u u chưa phản ánh được đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa, giá trị của R thường tăng vọt khi xuất hiện giá trị ngoại lệ trong mẫu số liệu. Do đó, để phản ánh mức độ phân tán của số liệu, người ta còn dùng các số đặc trưng khác. Ví dụ 1: Cô Hà thống kê lại đường kính thân gỗ của một số cây xoan đào 6 năm tuổi được trồng ở một lâm trường ở bảng sau. Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm trên. Lời giải Khoảng biến thiên của mẫu số liệu ghép nhóm trên là 65 40 25 cm. Ý nghīa của khoảng biến thiên của mẫu số liệu ghép nhóm - Khoảng biến thiên của mẫu số liệu ghép nhóm là giá trị xấp xỉ khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu.
- Khoảng biến thiên R k 1 1 u u chưa phản ánh được đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa, giá trị của R thường tăng vọt khi xuất hiện giá trị ngoại lệ trong mẫu số liệu. Do đó, để phàn ánh mức độ phân tán của sổ liệu, người ta còn dùng các số đặc trưng khác. Ví dụ 2: Sử dụng dữ liệu ở biểu đồ trong , chọn số thích hợp thay vào các vị trí được đánh dấu? ở bảng sau: a) Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thề dục buổi sáng mỗi ngày của bác Bình và bác An . b) Sử dụng khoảng biến thiên, hãy cho biết bác nào có thời gian tập phân tán hơn. Lời giải a) Ta có bảng sau: Khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác Bình là 40 15 25 (phút). Tuy nhiên, trong mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An, khoảng đầu tiên chứa dữ liệu là 20;25 và khoảng cuối cùng chứa dữ liệu là 25;30 . Do đó khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An là 30 20 10 (phút). b) Nếu căn cứ theo khoảng biến thiên thì bác Bình có thời gian tập phân tán hơn bác An. 2.. KHOẢNG TỨ PHÂN VỊ Tứ phân vị thứ i , kí hiệu là Qv , với i 1,2,3 của mẫu số liệu ghép nhóm (Bảng 1) được xác định như sau: 1 4 , i m m m m in C Q u u u n
Trong đó: • 1 2 k n n n n là cỡ mẫu; • um ;um1 là nhóm chứa tứ phân vị thứ i ; • mn là tần số của nhóm chứa tứ phân vị thứ i ; • C 1 2 m 1 n n n . Khoảng tứ phân vị của mẫu số liệu ghép nhóm cũng được xác định dựa trên tứ phân vị thứ nhất và tứ phân vị thứ ba như đối với mẫu số liệu không ghép nhóm. Khoảng tứ phân vị của mẫu số liệu ghép nhóm cho ở Bảng 1, kí hiệu ΔQ , là hiệu giữa tứ phân vị thứ ba Q3 và tứ phân vị thứ nhất Q1 của mẫu số liệu ghép nhóm đó, tức là: Δ 3 1 . Q Q Q Ví dụ 3: Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trong hoạt động 1. Lời giải Cỡ mẫu n 50 . Gọi 1 2 50 x ; x ;; x là mẫu số liệu gốc gồm cân nặng của 50 quả xoài được xếp theo thứ tự không giảm. Ta có: x1 , x2 , x3 250;290; x4 ,, x16 290;330; x17 ,, x34 330;370; x35 ,, x45 370;410; x46 ,, x50 410;450 . Tứ phân vị thứ nhất của mẫu số liệu gốc là x13 290;330 . Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là 1 50 3 4150 4 290 330 290 . 13 13 Q Tứ phân vị thứ ba của mẫu số liệu gốc là x38 370;410. Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là 3 3 50 3 13 18 4210 4 370 410 370 . 11 11 Q Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là
4210 4150 9080 Δ 11 13 143 Q Ý nghīa của khoảng tứ phân vi của mẫu số liêu ghép nhóm ✓ Khoảng tứ phân vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của nửa giữa của mẫu số liệu (tập hợp gồm 50% số liệu nằm chính giữa mẫu số liệu). ✓ Khoảng tứ phân vị của mẫu số liệu ghép nhóm càng nhỏ thì dữ liệu càng tập trung xung quanh trung vị. ✓ Khoảng tứ phân vị được dùng để xác định giá trị ngoại lệ trong mẫu số liệu. Giá trị x trong mẫu số liệu là giá trị ngoại lệ nếu 3 1,5ΔQ x Q hoặc 1 1,5ΔQ x Q . ✓ Khoảng tứ phân vị của mẫu số liệu ghép nhóm không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ trong mẫu số liệu. Ví dụ 4: Hằng ngày ông Thắng đều đi xe buýt từ nhà đến cơ quan. Dưới đây là bảng thống kê thời gian của 100 lần ông Thắng đi xe buýt từ nhà đến cơ quan. a) Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trên. b) Biết rằng trong 100 lần đi trên, chỉ có đúng một lần ông Thắng đi hết hơn 29 phút. Thời gian của lần đi đó có phải là giá trị ngoại lệ không? Lời giải a) Cỡ mẫu n 100 . Gọi 1 2 100 x ; x ;; x là mẫu số liệu gốc gồm thời gian 100 lần đi xe buýt của ông Thắng. Ta có: x1 ,, x22 15;18; x23 ,, x60 18;21; x61 ,, x87 21;24; x88 ,, x95 24;27 ; x96 ,, x99 27;30; x100 30;33 . Tứ phân vị thứ nhất của mẫu số liệu gốc là 25 26 1 18;21 2 x x . Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là 1 100 22 693 4 18 21 18 . 38 38 Q Tứ phân vị thứ ba của mẫu số liệu gốc là 75 76 1 21;24 2 x x . Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là