Nội dung text TOAN-11_C5_B1.1_CÁC SỐ ĐẶC TRƯNG CỦA MẪU-SỐ-LIỆU-GHÉP-NHÓM_TL_(File HS).pdf
CHUYÊN ĐỀ V – TOÁN – 11 – MỘT SỐ YẾU TỐ THỐNG KÊ VÀ XÁC SUẤT Page 1 Sưu tầm và biên soạn BÀI 1: CÁC SỐ ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM CHO MẪU SỐ LIỆU GHÉP NHÓM I. MẪU SỐ LIỆU GHÉP NHÓM 1. bảng tần số ghép nhóm Mẫu số liệu ghép nhóm là mẫu số liệu cho dưới dạng bảng tần số ghép nhóm. mỗi nhóm số liệu gồm một số giá trị của mẫu số liệu được ghép nhóm theo một tiêu chí xác định có dạng a;b , trong đó a là đầu mút trái, b là đầu mút phải. độ dài nhóm là b a . Tần số của một nhóm là số liệu trong mẫu số liệu thuộc vào nhóm đó. Tần số của nhóm 1, nhóm 2 , ..., nhóm m kí hiệu lần lượt là 1 2 , ,..., m n n n . Bảng tần số ghép nhóm được lập ở Bảng 2, trong đó mẫu số liệu n số liệu được chia thành m nhóm ứng với m nữa khoảng a1 ;a2 ; a2 ;a3 ;...;am ;am1 , ở đó 1 2 1 ... m m a a a a và 1 2 ... m n n n n . Nhóm Tần số a1 ;a2 a2 ;a3 ... am ;am1 1 n 2 n mn n 2. Ghép nhóm mẫu số liệu. Tần số tích luỹ Để chuyển mẫu số liệu không ghép nhóm thành mẫu số liệu ghép nhóm, ta thực hiện như sau: Chia miền giá trị của mẫu số liệu thành một số nhóm theo tiêu chí cho trước. Đếm số giá trị của mẫu số liệu thuộc mỗi nhóm (tần số) và lập bảng tần số ghép nhóm. Chú ý: Khi ghép nhóm số liệu, ta thường phân chia các nhóm có độ dài bằng nhau và đầu mút của các nhóm có thể không phải là giá trị của mẫu số liệu. Nhóm cuối cùng có thể là am ;am1 Tần số tích luỹ của một nhóm là số số liệu trong mẫu số liệu có giá trị nhỏ hơn giá trị đầu mút phải của nhóm đó. Tần số tích luỹ của nhóm 1, nhóm 2,, nhóm m kí hiệu lần lượt là 1 2 , , , m cf cf cf . Bảng tần số ghép nhóm bao gồm cả tần số tích luỹ được lập như ở bảng 5 Nhóm Tần số Tần số tích lũy a1 ;a2 2 3 a ;a ... 1 n 2 n ... 1 1 cf n 2 1 2 cf n n ... CHƯƠN G V MỘT SỐ YẾU TỐ THỐNG KÊ VÀ XÁC SUẤT LÝ THUYẾT. I = = = I
CHUYÊN ĐỀ V – TOÁN – 11 – MỘT SỐ YẾU TỐ THỐNG KÊ VÀ XÁC SUẤT Page 2 Sưu tầm và biên soạn 1 ; m m a a mn 1 2 ... m m cf n n n n Ví dụ 2. Bảng thống kê sau cho biết thời gian chạy (phút) của 30 vận động viên (VĐV) trong một giải chạy Marathon. Hãy chuyển mẫu số liệu trên sang mẫu số liệu ghép nhóm gồm sáu nhóm có độ dài bằng nhau và bằng 3. Lời giải Giá trị nhỏ nhất là 129, giá trị lớn nhất là 145 nên khoảng biến thiên là 145 129 16 . Tổng độ dài của sáu nhóm là 18. Để cho đối xứng, ta chọn đầu mút trái của nhóm đầu tiên là 27,5 và đầu mút phải của nhóm cuối cùng là 145,5 ta được các nhóm là 127,5;130,5, 130,5;133,5,,142,5;145,5. Đếm số giá trị thuộc mỗi nhóm, ta có mẫu số liệu ghép nhóm như sau: II. SỐ TRUNG BÌNH CỘNG (SỐ TRUNG BÌNH) 1. Định nghĩa Trong trường hợp tổng quát, ta có định nghĩa sau: Cho mẫu số liệu ghép nhóm như ở Bảng sau. Nhóm Giá trị Tần số tích lũy a1 ;a2 2 3 a ;a ... 1 ; m m a a 1 x 2 x ...mx 1 n 2 n ...mn 1 2 .. m n n n n Trung điểm i x của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm i là giá trị đại diẹnn của nhóm đó. Số trung bình cộng của mẫu số liệu ghép nhóm, kí hiệu x , được tính theo công thức: 1 1 2 2 m m n x n x n x x n 2. Ý nghĩa Như ta đã biết, số trung bình cộng của mẫu số liệu không ghép nhóm là giá trị trung bình cộng của các số trong mẫu số liệu đó, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu khi các số liệu trong mẫu ít sai lệch vối số trung bình cộng.
CHUYÊN ĐỀ V – TOÁN – 11 – MỘT SỐ YẾU TỐ THỐNG KÊ VÀ XÁC SUẤT Page 3 Sưu tầm và biên soạn Số trung bình cộng của mẫu số liệu sau khi ghép nhóm xấp xỉ với số trung bình cộng của mẫu số liệu không ghép nhóm ban đầu và có thể làm đại diện cho vị trí trung tâm của mẫu số liệu. III. TRUNG VỊ 1. Định nghĩa Trong trường hợp tổng quát, ta có định nghĩa sau: Cho mẫu số liệu ghép nhóm bao gồm cả tần số tích luỹ như ở Bảng 5. Giả sử nhóm k là nhóm đầu tiên có tẩn số tích luỹ lớn hơn hoặc bằng 2 n , tức là 1 2 k n c nhưng 2 k n cf . Ta gọi , , k r d n lần lượt là đầu mút trái, độ dài, tần số của nhóm k ; k 1 cf là tần số tích luỹ của nhóm k 1. Trung vị của mẫu số liệu ghép nhóm, kí hiệu Me được tính theo công thức sau: 1 2 . k e k n cf M r d n . 2. Ý nghĩa Trung vị của mẫu số liệu sau khi ghép nhóm xấp xỉ với trung vị của mẫu số liệu không ghép nhóm ban đầu và có thể dùng để đại diện cho mẫu số liệu đã cho. IV. TỨ PHÂN VỊ 1. Định nghĩa Trong trường hợp tổng quát, ta có định nghĩa sau: Cho mẫu số liệu ghép nhóm bao gồm cả tần số tích luỹ như ở Bảng 5. • Tứ phân vị thứ hai của mẫu số liệu ghép nhóm được xác định như sau: Tứ phân vị thứ hai Q2 bằng trung vị M e ' Giả sử nhóm p là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 4 n , tức là 1 4 p n cf nhưng 4 p n cf . Ta gọi , , p s h n lần lượt là đầu mút trái, độ dài, tần số của nhóm 1 ; p p cf là tần số tích luỹ của nhóm p 1. Tứ phân vị thứ nhất Q1 được tính theo công thức sau: 1 1 4 . p p n cf Q s h n Giả sử nhóm q là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 3 4 n , tức là 1 3 4 q n cf nhưng 3 4 q n cf . Ta gọi , , q t l n lần lượt là đầu mút trái, độ dài, tần số của nhóm q ; q 1 cf là tần số tích luỹ của nhóm q 1.
CHUYÊN ĐỀ V – TOÁN – 11 – MỘT SỐ YẾU TỐ THỐNG KÊ VÀ XÁC SUẤT Page 4 Sưu tầm và biên soạn Tứ phân vị thứ ba Q3 được tính theo công thức sau: 1 3 3 4 . q q n cf Q t l n . 2. Ý nghĩa Như ta đã biết, đối với mẫu số liệu không ghép nhóm đã sắp xếp theo thứ tự từ nhỏ đến lớn, các điểm 1 2 3 Q ,Q ,Q chia mẫu số liệu đó thành bốn phần, mỗi phần đều chứa 25% giá trị. Bằng cách ghép nhóm mẫu số liệu và tính toán tứ phân vị của mẫu số liệu ghép nhóm, ta nhận được ba giá trị mới cũng có thể dùng để đại diện cho mẫu số liệu đã cho. Lưu ý rằng bộ ba giá trị 1 2 3 Q ,Q ,Q trong tứ phân vị của mẫu số liệu sau khi ghép nhóm xấp xỉ với bộ ba giá trị trong tứ phân vị của mẫu số liệu không ghép nhóm ban đầu. V. MỐT 1. Định nghĩa Giả sử nhóm i là nhóm có tần số lớn nhất. Ta gọi , , i u g n lần lượt là đầu mút trái, độ dài, tần số của nhóm 1 1 ; , i i i n n lần lượt là tần số của nhóm i 1, nhóm i 1 . Mốt của mẫu số liệu ghép nhóm, kí hiệu Mo , được tính theo công thức sau: 1 1 1 . 2 i i o i i i n n M u g n n n Chú ý: Khi i 0 thì 0 n 0; Khi i m thì 1 0 mn . 2. Ý nghĩa Như ta đã biết, mốt của một mẫu số liệu không ghép nhóm đặc trưng cho số lần lặp đi lặp lại nhiều nhất tại một giá trị của mẫu số liệu đó. Vì thế, có thể dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng nhau. Bằng cách ghép nhóm mẫu số liệu và tính toán mốt của mẫu số liệu ghép nhóm, ta nhận được giá trị mới cũng có thể dùng để đo xu thế trung tâm của mẫu số liệu đã cho. Mốt của mẫu số liệu sau khi ghép nhóm xấp xỉ với mốt của mẫu số liệu không ghép nhóm ban đầu. Một mẫu số liệu ghép nhóm có thể có nhiều mốt.