Nội dung text [SIU] 24MCS1 - Mid-term
BÀI TẬP QUÁ TRÌNH Thiết kế mạng MLP cho bài toán dự đoán Đề bài: Thiết kế một mạng Perceptron đa tầng (MLP) để dự đoán đầu ra dựa trên đầu vào . Hãy thực hiện các bước sau để giải quyết bài toán mà không cần viết mã nguồn, chỉ cần trình bày chi tiết quá trình thực hiện. 1. Cấu trúc mạng MLP ● Số lượng đầu vào: 2 (vector ) ● Một lớp ẩn: o Gồm 2 nơ-ron, sử dụng hàm kích hoạt ReLU. ● Một lớp đầu ra: o Gồm 1 nơ-ron, sử dụng hàm kích hoạt sigmoid. 2. Thông số ban đầu ● Trọng số và bias cho lớp ẩn (lớp đầu tiên): ● Trọng số và bias cho lớp đầu ra (lớp thứ hai): 3. Dữ liệu huấn luyện Gồm 5 mẫu dữ liệu với đầu vào và đầu ra thực tế : x1 x2 y 0.5 0.2 1 0.3 0.8 0 0.6 0.1 1 0.1 0.4 0 0.9 0.7 1
4. Nhiệm vụ Hãy thực hiện từng bước sau: 1. Lan truyền tiến (Forward Propagation): o Tính đầu ra của lớp ẩn . o Tính đầu ra dự đoán . 2. Tính hàm mất mát (Loss): o Sử dụng hàm mất mát binary cross-entropy: 3. Lan truyền ngược (Backpropagation): o Tính gradient của hàm mất mát đối với . o Công thức chi tiết: ▪ Gradient của : ▪ Gradient của : ▪ Gradient của : 4. Cập nhật tham số: o Sử dụng Gradient Descent với tốc độ học : 5. Yêu cầu ● Thực hiện từng bước tính toán trên mẫu đầu tiên để minh họa. ● Ghi lại kết quả: o Đầu ra lớp ẩn . o Đầu ra dự đoán . o Giá trị hàm mất mát . o Cập nhật trọng số và bias .
6. Kết quả cuối cùng ● Trình bày tất cả các bước tính toán trong báo cáo dưới dạng bảng và giải thích rõ ràng cách từng tham số được cập nhật.