Nội dung text Toán 12_Tập 1 C3_Bài 1 & 2. Thống kê CTST_bản GV.pdf
283 PHẦN THỐNG KÊ VÀ XÁC SUẤT Chương III. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU GHÉP NHÓM i . h ng i n thiên v h ng t h n v ẫu số i u ghép nhóm A. i n th ần nhớ 1. Kho ng bi n thiên ) Đ nh nghĩ Khoảng biến thiên, kí hiệu R, của mẫu số liệu ghép nhóm là hiệu số giữa đầu mút phải của nhóm cuối cùng và đầu mút trái của nhóm đầu tiên có chứa dữ liệu của mẫu số liệu. Chẳng hạn: Xét mẫu số liệu ghép nhóm được cho ở bảng sau: (Bảng 1) Nhóm [ 1 u ; 2 u ) [ 2 u ; 3 u ) ... [ k u ; k 1 u ) Tần số 1 n 2 n ... k n Nếu 1 n và k n cùng lớn hơn 0 thì R u u k1 1 . Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc. ) Ý nghĩ h ng i n thiên ẫu số i u ghé nhó Khoảng biến thiên của mẫu số liệu ghép nhóm là giá trị xấp xỉ khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán. Khoảng biến thiên R u u k1 1 chưa phản ánh được đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa, giá trị của R thường tăng vọt khi xuất hiện giá trị bất thường (còn gọi là giá trị ngoại lệ) trong mẫu số liệu. Do đó, để phản ánh mức độ phân tán của số liệu, người ta còn dùng các số đặc trưng khác. 2. Kho ng t phân v ) Đ nh nghĩ Xét mẫu số liệu ghép nhóm được cho ở bảng sau: (Bảng 1) Nhóm [ 1 u ; 2 u ) [ 2 u ; 3 u ) ... [ k u ; k 1 u ) Tần số 1 n 2 n ... k n Tứ phân vị thứ k, kí hiệu là Qk , với k = 1, 2, 3 của mẫu số liệu ghép nhóm (Bảng 1) được xác định như sau: 1 4 ( ) k m m m m kn C Q u u u n , trong đó: • 1 2 ... k n n n n là cỡ mẫu; • u u m m ; 1 là nhóm chứa tứ phân vị thứ k; • m n là tần số của nhóm chứa tứ phân vị thứ k; • 1 2 1 ... . C n n n m Nếu tứ phân vị thứ k là 1 1 2 m m x x , trong đó m x và m 1 x thuộc hai nhóm liên tiếp, ví dụ như x u u m j j 1 ; và x u u m j j 1 1 ; thì ta lấy Q u k j . Khoảng tứ phân vị của mẫu số liệu ghép nhóm cũng được xác định dựa trên tứ phân vị thứ nhất và tứ phân vị thứ ba như đối với mẫu số liệu không ghép nhóm. Khoảng tứ phân vị của mẫu số liệu ghép nhóm cho ở Bảng 1, kí hiệu ∆Q, là hiệu giữa tứ phân vị thứ ba Q3 và tứ phân vị thứ nhất Q1 của mẫu số liệu ghép nhóm đó, tức là ∆Q = Q3 – Q1. ) Ý nghĩ h ng t h n v ẫu số i u ghé nhó Khoảng tứ phân vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của nửa giữa của mẫu số liệu (tập hợp gồm 50% số liệu nằm chính giữa mẫu số liệu).
284 Khoảng tứ phân vị của mẫu số liệu ghép nhóm càng nhỏ thì dữ liệu càng tập trung xung quanh trung vị. Khoảng tứ phân vị được dùng để xác định giá trị bất thường (giá trị ngoại lệ) trong mẫu số liệu. Giá trị x trong mẫu số liệu là giá trị ngoại lệ nếu x > Q3 + 1,5∆Q hoặc x < Q1 − 1,5∆Q. Khoảng tứ phân vị của mẫu số liệu ghép nhóm không bị ảnh hưởng nhiều bởi các giá trị bất thường (giá trị ngoại lệ) trong mẫu số liệu. 3. Một số ki n th c bổ trợ quan trọng Một số quy tắ ghé nhó ẫu số i u Mỗi mẫu số liệu có thể được ghép nhóm theo nhiều cách khác nhau nhưng thường tuân theo một số quy tắc sau: Sử dụng từ k 5 đến k 20 nhóm. Cỡ mẫu càng lớn thì cần càng nhiều nhóm số liệu. Các nhóm có cùng độ dài bằng L thoả mãn R k L . , trong đó R là khoảng biến thiên, k là số nhóm. Giá trị nhỏ nhất của mẫu số thuộc vào nhóm u u 1 2 ; và càng gần 1 u càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm u u k k ; 1 và càng gần k 1 u càng tốt. Xét ẫu số i u ghé nhó đượ h ở ng s u: ( ng ) Nhóm [ 1 u ; 2 u ) [ 2 u ; 3 u ) ... [ k u ; k 1 u ) Tần số 1 n 2 n ... k n Giá trị chính giữa của mỗi nhóm được dùng làm giá tr đại di n cho nhóm ấy. Ví dụ nhóm u u 1 2 ; có giá trị đại diện là 1 2 1 2 u u . Hiệu j j 1 u u được gọi là độ d i nhó u u j j ; 1 . Số trung bình của mẫu số liệu ghép nhóm: 1 1 2 2 ... k k n c n c n c x n , trong đó 1 ... k n n n n và i c là giá trị đại diện của từng nhóm số liệu. Mốt Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất. Giả sử nhóm chứa mốt là u u m m ; 1 , khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là MO , được xác định bởi công thức 1 1 1 1 m m O m m m m m m m n n M u u u n n n n Chú ý: Nếu không có nhóm kể trước của nhóm chứa mốt thì 1 0 m n . Nếu không có nhóm kề sau của nhóm chứa mốt thì 1 0 m n . Trung v Giả sử nhóm u u m m ; 1 chứa trung vị; m n là tần số của nhóm chứa trung vị; 1 2 1 ... C n n n m . Khi đó: 1 2 . e m m m m n C M u u u n . . Cá dạng i tậ & hương há gi i Dạng 1. Kho ng bi n thiên Ví dụ . Biểu đồ dưới đây thống kê thời gian tập thể dục buổi sáng mỗi ngày trong tháng 9/2022 của bác Bình và bác An
285 a) Em hãy chọn số thích hợp thay vào các vị trí được đánh dấu ? ở bảng sau: Thời gian (phút) [15; 20) [20; 25) [25; 30) [30; 35) [35; 40) Bác Bình ? 12 8 3 2 Bác An ? ? ? ? ? b) Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng mỗi ngày của bác Bình và bác An. Lời giải tham khảo a) Ta có bảng sau: Thời gian (phút) [15; 20) [20; 25) [25; 30) [30; 35) [35; 40) Bác Bình 5 12 8 3 2 Bác An 0 25 5 0 0 b) Khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác Bình là 40 – 15 = 25 (phút). Tuy nhiên, trong mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An, khoảng đầu tiên chứa dữ liệu là [20; 25) và khoảng cuối cùng chứa dữ liệu là [25; 30). Do đó khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An là 30 – 20 = 10 (phút). Ví dụ 2. Bảng sau thống kê cân nặng của 50 quả xoài Thanh Ca được lựa chọn ngẫu nhiên sau khi thu hoạch ở một nông trường. Cân nặng (g) [250; 290) [290; 330) [330; 370) [370; 410) [410; 450) Số quả xoài 3 13 18 11 5 a) Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm trên. b) Có ý kiến cho rằng: “Trong 50 quả xoài trên, hiệu số cân nặng của hai quả bất kì không vượt quá 200 g”. Ý kiến đó đúng hay sai? Giải thích. Lời giải tham khảo a) Khoảng biến thiên của mẫu số liệu ghép nhóm trên là: 450 – 250 = 200 (g). b) Ý kiến đó đúng. Vì: ta thấy trong bảng số liệu, cân nặng lớn nhất quả xoài có thể đạt được là 450 g , còn cân nặng bé nhất quả xoài có thể đạt được là 250 g . Do đó, bất kì hai quả nào cūng có hiệu số cân nặng không vượt quá 200 g
286 Ví dụ 3. Cô Hà thống kê lại đường kính thân gỗ của một số cây xoan đào 6 năm tuổi được trồng ở một lâm trường ở bảng sau. Đường kính (cm) [40; 45) [45; 50) [50; 55) [55; 60) [60; 65) Tần số 5 20 18 7 3 Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm trên. Lời giải tham khảo Khoảng biến thiên của mẫu số liệu ghép nhóm trên là: 65 – 40 = 25 (cm). Ví dụ 4. Bạn Trang thống kê lại chiều cao (đơn vị: cm) của các bạn học sinh nữ lớp 12C và lớp 12D ở bảng sau: Nếu so sánh theo khoảng biến thiên thì chiều cao của học sinh lớp nào có độ phân tán lớn hơn? Lời giải tham khảo Khoảng biến thiên của chiều cao của các bạn học sinh nữ lớp 12C là: 185 155 30( cm) Khoảng biến thiên của chiều cao của các bạn học sinh nữ lớp 12D là: 180 155 25( cm) Vậy nếu so sánh theo khoảng biến thiên thì chiều cao của học sinh lớp 12C có độ phân tán lớn hơn Dạng 2. Kho ng t phân v Ví dụ 5. Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trong bảng dưới đây. Cân nặng (g) [250; 290) [290; 330) [330; 370) [370; 410) [410; 450) Số quả xoài 3 13 18 11 5 Lời giải tham khảo Cỡ mẫu n = 50. Gọi x1; x2; ...; x50 là mẫu số liệu gốc gồm cân nặng của 50 quả xoài được xếp theo thứ tự không giảm. Ta có: x1, x2, x3 ∈ [250; 290); x4, ..., x16 ∈ [290; 330); x17, ..., x34 ∈ [330; 370); x35, ..., x45 ∈ [370; 410); x46, ..., x50 ∈ [410; 450). Tứ phân vị thứ nhất của mẫu số liệu gốc là x13 ∈ [290; 330). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là: 1 50 3 4150 4 290 (330 290) 13 13 Q Tứ phân vị thứ ba của mẫu số liệu gốc là x38 ∈ [370; 410). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là: 3 3.50 (3 13 18) 4210 4 370 (410 370) 11 11 Q Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là: 4210 4150 9080 11 13 143 Q Ví dụ 6. Bạn Trang thống kê lại chiều cao (đơn vị: cm) của các bạn học sinh nữ lớp 12C và lớp 12D ở bảng sau: