PDF Google Drive Downloader v1.1


Báo lỗi sự cố

Nội dung text Chuong 1 - Giới thiệu PTDL.docx

1 CHƯƠNG 1: GIỚI THIỆU VỀ PHÂN TÍCH DỮ LIỆU 1.1. Thu thập dữ liệu Thu thập dữ liệu là quá trình thu thập và đo lường thông tin về các biến được nhắm mục tiêu trong một hệ thống đã được thiết lập, sau đó cho phép một người trả lời các câu hỏi có liên quan và đánh giá kết quả. Thu thập dữ liệu là một thành phần của nghiên cứu trong tất cả các lĩnh vực nghiên cứu bao gồm khoa học vật lý và xã hội, nhân văn và trong kinh doanh. Mục tiêu của tất cả việc thu thập dữ liệu là thu thập bằng chứng chất lượng cho phép phân tích dẫn đến việc đưa ra các câu trả lời thuyết phục và đáng tin cậy cho các câu hỏi đã được đặt ra. 1.1.1. Dạng dữ liệu: định tính và định lượng Dữ liệu là tập hợp các thông tin được thu thập, lưu trữ và xử lý để sử dụng cho mục đích nghiên cứu, quản lý hỗ trợ ra quyết định. Dữ liệu có vai trò rất quan trọng trong cuộc sống hiện đại được sử dụng rộng rãi trong nhiều lĩnh vực như kinh doanh, khoa học, y tế, giáo dục và nhiều lĩnh vực khác nhằm giải quyết các vấn đề phức tạp và cải thiện chất lượng cuộc sống. Có hai loại dữ liệu đó là : dữ liệu định tính và dữ liệu định lượng. Dữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính được trị trung bình của dữ liệu dạng định tính. Một số ví dụ về dữ liệu định tính: giới tính: nam hay nữ; kết quả học tập của sinh viên: giỏi, khá, trung bình, yếu… Dữ liệu định lượng: loại dữ liệu này phản ánh mức độ, sự hơn kém và ta tính được giá trị trung bình. Nó thể hiện bằng con số thu thập được ngay trong quá trình điều tra khảo sát, các con số này có thể ở dạng biến thiên liên tục hay rời rạc. Lưu ý: các phép toán thống kê dùng cho dữ liệu định tính có những đặc điểm khác với phép toán dùng cho dữ liệu định lượng. 1.1.2. Các thang đo dữ liệu Thang đo định danh (Nominal scale) Thang đo danh nghĩa là loại thang đo dựa trên sự phân loại và đặt tên cho các đối tượng. Các đối tượng trong bảng dữ liệu sau khi được đặt tên sẽ mang một ký số và từ đó dễ dàng để phân loại hơn. Ví dụ, thang đo danh nghĩa được sử dụng trong trường hợp sau đây: Bạn là học sinh hay sinh viên? 1. Học sinh 2. Sinh viên Trong trường hợp này, thang đo định danh đã quy ước biến “nghề nghiệp” thành các giá trị Học sinh = 1, Sinh viên = 2. Những con số ở đây không có giá trị về mặt tính toán mà chỉ mang ý nghĩa định danh.
2 Thang đo danh nghĩa thường được sử dụng để tính tần suất, đếm, thực hiện các phép kiểm định … Thang đo thứ bậc (Ordinal scale) Đây là mức độ nâng cao của thang đo định danh. Thang đo thứ bậc cũng dùng các con số định danh nhưng chúng được sắp xếp theo các thứ bậc hơi kém. Thang đo thứ bậc là thang đo danh nghĩa nhưng không phải thang đo danh nghĩa nào cũng là thang đo thứ bậc. Một ví dụ về thang đo thứ bậc: Năm vừa rồi bạn xếp hạng gì? 1. Xuất sắc 2. Giỏi 3. Khá 4. Trung bình Ở mỗi câu trả lời được mã hóa, chúng ta có thể xác định được mức độ cao thấp của xếp hạng với mỗi người cho dữ liệu. Điểm đặc biệt của phương pháp này là khuynh hướng trung tâm được xem xét bằng số trung vị và số yếu vị, độ phân tán đo bằng khoảng biến thiên và khoảng tứ phân vị. Thang đo khoảng (Interval scale) Đây là dạng thang đo có thể tính được khoảng cách giữa các thứ bậc. Các giá trị của thang đo khoảng có thể cộng hoặc trừ lẫn nhau (nhưng không thể nhân/chia) và không chứa giá trị 0 tuyệt đối (năm 0 trước công nguyên, 0 o F...). Ví dụ khoảng thời gian giữa năm 1981 và 1982 là bằng với khoảng thời gian giữa năm 1983 và 1984 (đều có 1 năm). Bên cạnh đó, thang đo khoảng cũng sử dụng để đo các trạng thái tâm lý phức tạp, người tạo ra một dãy số từ bé đến lớn, với hai đầu là hai mức độ hoàn toàn trái ngược. Ví dụ: Để hỏi mức độ hài lòng với sản phẩm mới, khách hàng có thể chọn các giá trị từ 1 đến 7 với 1 = không hài lòng và 7 = cực kỳ hài lòng. Thang đo tỷ lệ (Ratio scale) Đúng như tên gọi của mình, thang đo tỷ lệ cho phép người dùng chia dữ liệu theo tỉ lệ để dễ dàng so sánh. Thang đo tỷ lệ có đầy đủ các đặc tính về khoảng cách và thứ tự của thang đo khoảng, giúp tính toán phân tích thống kê. Ví dụ: Bạn hãy cho biết khoản chi mua sắm điện thoại mỗi tháng (triệu đồng)? Dữ liệu thu về sẽ giúp chúng ta tính toán được mức độ chi tiêu ở mức này gấp bao nhiêu lần mức độ khác.
3 Thang đo chúng ta lựa chọn phụ thuộc đến tính chất của dữ liệu thu thập. Với thang đo định danh và thang đo thứ bậc, ta áp dụng cho dữ liệu dưới dạng định tính. Tuy nhiên, thang đo khoảng và tỷ lệ lại áp dụng cho dữ liệu định lượng. Ngoài ra, tùy vào lại thang đo sử dụng mà bạn có thể chọn các phép toán thống kê khác nhau. Với thang đo định danh hay thứ bậc, ta sẽ tính tỷ lệ % và số yếu vị. Và với thang đo cho dữ liệu định lượng như thang đo khoảng và tỷ lệ, ta sẽ áp dụng nhiều phép toán khác như trung bình, phương sai, độ lệch chuẩn, phân tích hồi quy... Bên cạnh đó, trong khi nghiên cứu, ta còn có khả năng chuyển đổi từ dữ liệu định lượng về định tính. Tuy nhiên quá trình chuyển đổi này không thể thực hiện ở chiều còn lại vì dữ liệu ở bậc thấp hơn không thể chuyển lên bậc cao hơn. Và cuối cùng, các mức độ trong thang đo khoảng hoàn toàn chưa được lập theo tiêu chuẩn cụ thể nào mà chủ yếu dựa vào cảm tính của người trả lời. Vì thế, người đặt câu hỏi nên làm cho câu hỏi của mình rõ ràng và chi tiết nhất có thể. 1.1.3. Nguồn thu thập dữ liệu: thứ cấp và sơ cấp Thu thập dữ liệu là quá trình thu thập thông tin hoặc dữ liệu từ các nguồn khác nhau để sử dụng trong nghiên cứu hoặc phân tích. Có nhiều phương pháp thu thập dữ liệu khác nhau phù hợp với mục đích nghiên cứu và loại dữ liệu cần thu thập. Dữ liệu sơ cấp Dữ liệu sơ cấp (Primary data) là dữ liệu thu thập mới từ nguồn trực tiếp bằng cách sử dụng các phương pháp nghiên cứu như khảo sát, phỏng vấn, thí nghiệm, quan sát,… Phương pháp thu thập dữ liệu sơ cấp giúp cho nhà nghiên cứu có được thông tin mới và chi tiết hơn về đối tượng nghiên cứu. Dữ liệu sơ cấp là những dữ liệu chưa có sẵn, được thu thập lần đầu, do chính người nghiên cứu thu thập. Trong thực tế, khi dữ liệu thứ cấp không đáp ứng được yêu cầu nghiên cứu, hoặc không tìm được dữ liệu thứ cấp phù hợp thì các nhà nghiên cứu sẽ phải tiến hành thu thập dữ liệu sơ cấp. Các dữ liệu sơ cấp sẽ giúp giải quyết cấp bách và kịp thời những vấn đề đặt ra. Dữ liệu sơ cấp là do trực tiếp thu thập nên độ chính xác cao hơn. Tuy nhiên, dữ liệu sơ cấp phải qua quá trình nghiên cứu thực tế mới có được, vì vậy việc thu thập dữ liệu sơ cấp thường tốn nhiều thời gian và chi phí. Vì vậy, các nhà nghiên cứu sẽ phải cân nhắc khi nào sẽ phải thu thập dữ liệu sơ cấp và lựa chọn phương pháp thu thập hiệu quả để hạn chế nhược điểm này. Các phương pháp thu thập dữ liệu sơ cấp bao gồm:
4  Khảo sát (Survey), dành cho số đông: Là phương pháp thu thập dữ liệu thông qua việc trực tiếp hỏi ý kiến của người được nghiên cứu bằng cách sử dụng các câu hỏi chuẩn hoặc phi chuẩn. o Khảo sát cá nhân trực tiếp: Đây là phương pháp thu thập dữ liệu mà người khảo sát và người được khảo sát gặp nhau trực tiếp để hỏi và trả lời. Địa điểm khảo sát thường ở các trung tâm thương mại, trên đường phố, trên phương tiện giao thông công cộng hay tại nhà ở. Mức độ chính xác của số liệu thu thập phụ thuộc vào kỹ năng đặt câu hỏi một cách khéo léo, sự tinh tế trong việc nêu câu hỏi nhằm theo dõi và kiểm tra đối tượng khảo sát. o Khảo sát nhóm cố định: Nhóm cố định bao gồm một số đối tượng không đổi, định kỳ trả lời các bảng câu hỏi (người tiêu dùng, hộ gia đình, doanh nghiệp…). Tùy theo mục tiêu khảo sát, có thể duy trì nhóm cố định trong một tuần, một tháng, một năm hay nhiều hơn. Hình thức khảo sát nhóm cố định: khảo sát cá nhân các thành viên trong nhóm, khảo sát bằng điện thoại hay thư tín. o Khảo sát bằng điện thoại: Đây là phương pháp thu thập dữ liệu được tiến hành bằng cách bố trí một nhóm người khảo sát tập trung khảo sát khách hàng với nhiều máy điện thoại kết nối với tổng đài để dễ kiểm tra người khảo sát. Yêu cầu đối với người khảo sát là phải cảm nhận đối tượng khảo sát trong một khung cảnh mà anh ta không nhìn thấy. Phương pháp này được áp dụng khi số đông người được hỏi có máy điện thoại; và khi cuộc điều tra đòi hỏi phải có một mẫu nghiên cứu phân bố rộng trên các vùng địa lý thì phương pháp điều tra bằng điện thoại là tiện lợi nhất. o Khảo sát bằng thư tín: Với phương pháp này người khảo sát gửi cho người dự khảo sát một bảng câu hỏi qua đường bưu điện và chờ trả lời. Phương pháp này không phải bao giờ cũng tốt, nhưng nó có những ưu điểm mà các phương pháp khác lại không có. Phương pháp khảo sát bằng thư tín có thể đề cập đến nhiều vấn đề khác nhau, kể cả vấn đề riêng tư, và do không gặp mặt người hỏi nên người trả lời tự chủ khi trả lời câu hỏi, không bị chi phối bởi người hỏi. Không bị giới hạn chặt chẽ về thời gian nên người được hỏi có thể suy nghĩ chín chắn trước khi trả lời, và vào thời gian thuận tiện nhất. Có thể hỏi được nhiều người do phí tổn thấp;

Tài liệu liên quan

x
Báo cáo lỗi download
Nội dung báo cáo



Chất lượng file Download bị lỗi:
Họ tên:
Email:
Bình luận
Trong quá trình tải gặp lỗi, sự cố,.. hoặc có thắc mắc gì vui lòng để lại bình luận dưới đây. Xin cảm ơn.