Nội dung text BTTH CHƯƠNG 3.docx
CHƯƠNG 3 – PHÂN TÍCH HỒI QUY Nguồn tham khảo: Nguyễn Đình Thuân, Nguyễn Minh Nhựt, Nguyễn Thị Viết Hương, Trịnh Thị Thanh Trúc, Giáo trình Phân tích dữ liệu kinh doanh, NXB. ĐHQG-HCM, 2025 BTTH3. Hồi quy tuyến tính đơn biến với ngôn ngữ Python - Dataset: gồm 2 thuộc tính thu nhập (Income) và điểm tín dụng (Credit_Score) - Link down dataset: BT3.310092301_scoring_credit_linear.csv - Các yêu cầu: 1. Cài đặt, import các gói thư viện pandas 2. Đọc và in dữ liệu Hướng dẫn: Sử dụng hàm read_csv từ thư viện pandas 3. Import các thư viện hồi quy tuyến tính, thư viện đồ họa để vẽ đồ thị Hướng dẫn: Sử dụng thư viện numpy, sklearn (LinearRegression), matplotlib 4. Khởi tạo và huấn luyện mô hình với dữ liệu X là dataframe chứa dữ liệu của thuộc tính Income, y là series chứa dữ liệu của thuộc tính Credit_Score Hướng dẫn: Sử dụng hàm fit 5. Sử dụng mô hình đã huấn luyện để dự đoán giá trị y_pred Hướng dẫn: Sử dụng hàm predict 6. In ra các hệ số của mô hình hồi quy: hệ số chặn (intercept), hệ số hồi quy slope (coef), chỉ số R-squared của mô hình. Kết luận: hàm của mô hình hồi quy 7. Trực quan kết quả gồm dữ liệu thực tế, dữ liệu dự đoán và mô hình hồi quy tuyến tính Hướng dẫn: Sử dụng plot trong matplotlib 8. Tính và in ra MSE và RMSE của mô hình
BTTH4. Hồi quy tuyến tính đa biến với ngôn ngữ Python - Dataset: xây dựng mô hình dự đoán mức độ hài lòng (Satisfaction_Level) của khách hàng dựa trên thời gian sửa chữa (Repair_Time) và thời gian chờ đợi (Waiting_Time). Mối quan hệ giữa các thuộc tính này giúp các công ty hiểu rõ hơn về các yếu tố ảnh hưởng đến trải nghiệm khách hàng và cải thiện dịch vụ của mình. - Link down dataset: BT4.313092302_satisfaction_level.csv - Các yêu cầu: 1. Cài đặt, import các gói thư viện pandas 2. Đọc và in dữ liệu Hướng dẫn: Sử dụng hàm read_csv từ thư viện pandas 3. Import các thư viện hồi quy tuyến tính, thư viện đồ họa để vẽ đồ thị Hướng dẫn: Sử dụng thư viện numpy, sklearn (LinearRegression), matplotlib 4. Khởi tạo và huấn luyện mô hình với dữ liệu X là dataframe chứa dữ liệu của thuộc tính Repair_Time và Waiting_Time, y là series chứa dữ liệu của thuộc tính Satisfaction_Level Hướng dẫn: Sử dụng hàm fit 5. Sử dụng mô hình đã huấn luyện để dự đoán giá trị y_pred Hướng dẫn: Sử dụng hàm predict 6. In ra các hệ số của mô hình hồi quy: hệ số chặn (intercept), hệ số hồi quy slope (coef), chỉ số R-squared của mô hình. Kết luận: hàm của mô hình hồi quy 7. Trực quan kết quả gồm dữ liệu thực tế, dữ liệu dự đoán và mô hình hồi quy tuyến tính Hướng dẫn: Sử dụng mplot3d trong matplotlib 8. Tính và in ra MSE và RMSE của mô hình