Nội dung text [SGU][Assignment-2] NLP - DCT122C5 (2025-2026_HK1).docx
BÀI TẬP RNN TRONG DỊCH MÁY (MACHINE TRANSLATION) Hướng dẫn chung ● Bài kiểm tra tập trung vào thiết kế và tính toán mô hình Encoder-Decoder dựa trên Recurrent Neural Network (RNN) đơn giản để dịch một câu ngắn từ tiếng Anh sang tiếng Việt, nhằm mô phỏng quá trình dịch máy cơ bản. ● Sử dụng dữ liệu giả lập được cung cấp dưới đây để thực hiện các phép tính thủ công. ● Công thức RNN chuẩn phải được áp dụng chính xác trong tính toán forward pass. Lưu ý: Mô hình bao gồm một Fully Connected Layer (FC Layer) được tích hợp sau Decoder để chuyển đổi hidden state đầu tiên của Decoder thành output từ đầu tiên (ví dụ: "Tôi"). Sinh viên cần thực hiện tính toán cho cả Encoder, Decoder, và FC Layer để hoàn thành bài toán. Cơ chế hoạt động: Encoder xử lý tuần tự câu tiếng Anh "I like tea" để tạo context vector (), tóm tắt thông tin ngữ nghĩa của câu nguồn. Decoder sử dụng làm trạng thái ban đầu, tích hợp với input <SOS> (giả lập [0.0, 0.0]) để tạo hidden state đầu tiên (). FC Layer và Softmax chuyển thành xác suất cho các từ tiếng Việt đầu tiên ("Tôi", "thích", "trà"), với nhãn "Tôi" được chọn dựa trên ground truth. Loss được tính để đánh giá độ chính xác của dự đoán từ đầu tiên. ● Các câu hỏi lý thuyết tập trung vào kiến trúc và cơ chế hoạt động của RNN trong bài toán dịch máy. ● Nộp bài bao gồm mô tả kiến trúc, bảng mô tả tham số, tính toán chi tiết, và giải thích lý thuyết. ● Không sử dụng công cụ tính toán tự động; tất cả phép tính phải thực hiện thủ công. Dữ liệu ● Câu đầu vào (tiếng Anh): "I like tea" (3 từ: "I", "like", "tea"). ● Câu đầu ra (tiếng Việt): "Tôi thích trà" (3 từ: "Tôi", "thích", "trà"). ● Vocabulary và Word Embeddings (kích thước embedding = 2): o "I": [0.1, 0.2]