Nội dung text Toán thực tế 12_Chuyên đề 6_Thống kê_Đề bài.pdf
CHUYÊN ĐỀ 6. THỐNG KÊ A. KIẾN THỨC CƠ BẢN CẦN NẮM I. KHOẢNG BIẾN THIÊN Cho mẫu số liệu ghép nhóm: trong đó các tần số 1 0, 0 m m k và 1 k n m m = ++ là cỡ mẫu. Khoảng biến thiên của mẫu 1 1 ghép nhóm trên là . R a a = − k+ Ý nghĩa. Khoảng biến thiên của mẫu số liệu ghép nhóm xấp xỉ cho khoảng biến thiên của mẫu số liệu gốc. Khoảng biến thiên được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán. Lưu ý: Khoảng biến thiên của MSL ghép nhóm luôn khoảng biến thiên của MSL gốc. II. KHOẢNG TỨ PHÂN VỊ Tứ phân vị thứ r là ( ) ( ) 1 1 1 4 , p r p p p p r n m m Q a a a m − + − ++ = + − trong đó a a p p ; +1 ) là nhóm chứa tứ phân vị thứ r với r =1,2,3 . Khoảng tứ phân vị của mẫu số liệu ghép nhóm, kí hiệu là ΔQ , là hiệu số giữa tứ phân vị thứ ba Q3 và tứ phân vị thứ nhất Q1 của mẫu số liệu đó, tức là ΔQ = − Q Q 3 1 . Ý nghĩa. Khoảng tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc. Khoảng tứ phân vị cũng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm. Khoảng tứ phân vị càng lớn thì mẫu số liệu càng phân tán. Nhận xét. ▪ Do khoảng tứ phân vị của mẫu số liệu ghép nhóm chỉ phụ thuộc vào nửa giữa của mẫu số liệu, nên không bị ảnh hưởng bởi các giá trị bất thường và có thể dùng đại lượng này để loại giá trị bất thường. ▪ Khoảng tứ phân vị được dùng để xác định giá trị ngoại lệ trong mẫu số liệu. Giá trị x trong mẫu số liệu là giá trị ngoại lệ nếu 3 1 5, ΔQ x Q + hoặc 1 1 5, ΔQ x Q − III. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN 1. Phương sai Phương sai của mẫu số liệu ghép nhóm, kí hiệu 2 S , được tính bởi công thức: ( ) ( ) ( ) 2 2 2 2 1 1 2 2 1 k k S n c x n c x n c x n = − + − ++ − Trong đó: 1 2 k n n n n = + ++ là cỡ mẫu; ( 1 1 2 2 ) 1 k k x n c n c n c n = + ++ là số trung bình 2. Độ lệch chuẩn
Độ lệch chuẩn của mẫu số liệu ghép nhóm kí hiệu S , Độ lệch chuẩn là căn bậc hai số học của phương sai: Độ lệch chuẩn 2 = S Chú ý: ▪ Phương sai của mẫu số liệu ghép nhóm có thể được tính theo công thức sau: ( ) 2 2 2 2 2 1 1 2 2 1 k k S n c n c n c x n = + ++ − ▪ Trong thống kê, người ta còn dùng đại lượng sau để đo mức độ phân tán của mẫu số liệu ghép nhóm: ( ) ( ) ( ) 2 2 2 1 1 2 2 2 1 1 . k k S n c x n c x n c x n = − + − ++ − − Ý nghĩa: ▪ Phương sai của MSL ghép nhóm là giá trị xấp xỉ cho phương sai của MSL gốc. Độ lệch chuẩn của MSL ghép nhóm cũng là giá trị xấp xỉ cho độ lệch chuẩn của MSL gốc. ⎯⎯→ Được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm. ▪ Phương sai và độ lệch chuẩn càng lớn thì dữ liệu càng phân tán. ▪ Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu. B. BÀI TẬP VẬN DỤNG Câu 1: Dữ liệu về tốc độ của 100 xe ô tô lưu thông trên một đoạn đường cao tốc vào giờ cao điểm, được trích xuất từ camera của cơ quan cảnh sát giao thông. Hãy tìm khoảng biến thiên của mẫu số liệu (bảng số liệu hình bên dưới). Tốc độ (km/h) 60 70 ; ) 70 80 ; ) 80 90 ; ) 90 100 ; ) 100 110 ; ) Số xe 10 20 20 35 15 Câu 2: Thời gian hoàn thành bài kiểm tra của các bạn trong lớp 12A được cho bảng sau: Thời gian (phút) 25 30 ; ) 30 35 ; ) 35 40 ; ) 40 45 ; ) Số học sinh 8 16 4 2 a) Tính khoảng biến thiên R cho mẫu số liệu ghép nhóm trên. b) Nếu biết học sinh hoàn thành bài kiểm tra sớm nhất mất 27 phút và muộn nhất mất 43 phút. Hãy so sánh khoảng biến thiên của mẫu số liệu ghép nhóm và mẫu số liệu gốc. Câu 3: Để chuẩn bị mở một trung tâm thể dục thể thao, anh Tiến đã tiến hành điều tra tuổi thọ của máy chạy bộ (đơn vị: năm) do hai hãng X, Y sản xuất. Bảng biểu thị hai mẫu số liệu mà anh thu thập được qua Internet. Tuổi thọ 2 4; ) 4 6; ) 6 8; ) 8 10 ; ) 10 12 ; ) Số máy của hãng X 7 20 36 20 17 Số máy của hãng Y 0 20 35 35 10 Khoảng biến thiên của mẫu số liệu nào lớn hơn? Từ đó có thể nói là máy chạy bộ do hãng nào sản xuất có tuổi thọ phân tán hơn? Câu 4: Bảng dưới biểu thị kết quả điều tra thời gian sử dụng Internet hằng ngày của một số người. Thời gian (phút) 30 60 ; ) 60 90 ; ) 90 120 ; ) 120 150 ; ) 150 180 ; ) Số người 2 4 10 5 3 Tìm khoảng biến thiên của mẫu số liệu đã cho. Kết quả cho biết điều gì? Câu 5: Người ta tiến hành phỏng vấn hai nhóm khán giả về một bộ phim mới công chiếu. Nhóm A gồm những khán giả thuộc lứa tuổi 20 - 30, nhóm B thuộc lứa tuổi trên 30. Người được hỏi ý kiến
phải đánh giá bộ phim bằng cách cho điểm theo một số tiêu chí nêu trong phiếu điều tra và sau đó lấy tổng số điểm (thang điểm 100). Bảng dưới đây trình bày kết quả điều tra hai nhóm khán giả: Bảng. Điểm đánh giá của khán giả Điểm [50;60) [60;70) [70;80) [80;90) [90;100) Số người của nhóm A 6 10 14 12 8 Số người của nhóm B 0 8 14 28 0 Ý kiến đánh giá của nhóm khán giả nào phân tán hơn? Câu 6: Một người ghi lại thời gian đàm thoại của một số cuộc gọi cho kết quả như bảng sau: Thời gian t (phút) 0 1 t 1 2 t 2 3 t 3 4 t 4 5 t Số cuộc gọi 8 17 25 20 10 Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm trên. Câu 7: Thầy Cư rất thích chạy bộ. Thời gian chạy bộ mỗi ngày trong thời gian gần đây của Thầy Cư được thống kê lại ở bảng sau: Thời gian (phút) 20 25 ; ) 25 30 ; ) 30 35 ; ) 35 40 ; ) 40 45 ; ) Số ngày 6 6 4 1 1 Hãy tính khoảng tứ phân vị của mẫu số liệu ghép nhóm trong bảng trên. Câu 8: Khảo sát năng suất của một số thửa ruộng được minh họa ở biểu đồ sau: a) Có bao nhiêu thửa ruộng được khảo sát? b) Lập bảng tần số ghép nhóm c) Hãy xác định khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu trên. Câu 9: cho kết quả như sau: a) Hãy ghép nhóm dãy số liệu trên thành các nhóm có độ dài bằng nhau với nhóm đầu tiên là [40;50). b) Tính khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu gốc và mẫu số liệu ghép nhóm thu được ở câu a. Giá trị nào là giá trị chính xác? Giá trị nào là giá trị xấp xỉ? Câu 10: Thu nhập theo tháng (đơn vị: triệu đồng) của người lao động ở hai nhà máy như sau: Thu nhập [5;8) [8;11) [11;14) [14;17) [17;20)
Số người của nhà máy A 20 35 45 35 20 Số người của nhà máy B 17 23 30 23 17 Tính mức thu nhập trung bình của người lao động ở hai nhà máy trên. Dựa vào khoảng tứ phân vị, hãy xác định xem mức thu nhập của người lao động ở nhà máy nào biến động nhiều hơn. Câu 11: Bảng sau đây cho biết chiều cao của các học sinh lớp 12 A và 12 B . a) Tìm khoảng biến thiên, khoảng tứ phân vị cho các mẫu số liệu ghép nhóm về chiều cao của học sinh lớp 12A, 12B b) Để so sánh độ phân tán về chiều cao của học sinh hai lớp này ta nên dùng khoảng biến thiên hay khoảng tứ phân vị? Vì sao? Câu 12: Điểm kiểm tra cuối khoá môn Tiếng Anh của hai lớp ở một trung tâm ngoại ngữ được thống kê trong các Bảng a và b Bảng a. Điểm của lớp A Điểm Số học viên (tần số) [50;60) 8 [60;70) 20 [70;80) 50 [80;90) 17 [90;100) 5 Bảng b. Điểm của lớp B Điểm Số học viên (tần số) [50;60) 15 [60;70) 20 [70;80) 30 [80;90) 20 [90;100) 15 a) Tìm khoảng biến thiên của mỗi mẫu số liệu. Có thể dùng khoảng biến thiên để biết điểm của lớp nào đồng đều hơn không? b) Tìm các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu. c) Mẫu số liệu nào có độ phân tán lớn hơn? Minh hoạ câu trả lời bằng cách biểu diễn các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu trên trục số. Câu 13: Kết quả đo chiều cao của 100 cây dừa trồng sau 10 năm tại một vườn trái cây ở Bến Tre cho ở bảng sau: Chiều cao (m) 8 4 8 6 ,;, ) 8 6 8 8 , ; , ) 8 8 9 0 , ; , ) 9 0 9 2 , ; , ) 9 2 9 4 , ; , )