Content text [vi-VN] Special Localization Rules - Cypher Evals
[VI] Special Localization Rules Summary of changes Date Changed by Changed rating instructions to Localization (to align with new updates regarding Localization and Structure, Writing Style & Tone) 18/03/2025 Thuyen_QM_VN Created the first version 07/03/2025 Linh_QM_VN, Thuyen_QM_VN ENGLISH VERSION This document aims to clarify some special cases related to punctuation, capitalization, etc. that will be evaluated under Localization. If responses violate these rules, Localization will be penalized. According to the latest updates, grammar, spelling, punctuation, vocabulary and fluency aspects of writing style have been taken into account for Localization. Please note that Localization issues are not limited to these cases. Remember to also evaluate other elements such as Local perspective, Spelling, Word choice, Wrong Language, etc. Details on how to evaluate Localization can be found in the Revamp Instructions Doc. Error Category Rules Capitalization after colon Capitalization is applied in case a colon is followed by a proper noun (tên riêng/danh từ riêng), a complete quote (dẫn lời nói trực tiếp), a complete and independent sentence (một câu hoàn chỉnh và độc lập), an abbreviation (từ viết tắt), or a line break (xuống dòng). 1. A proper noun: Example: Các thành phố du lịch nổi tiếng ở Việt Nam là: Đà Nẵng, Đà Lạt, Hội An,... 2. A complete quote: Example: A nói: “Con mèo kia thật dễ thương”. B thấy vậy liền đáp: “Con cún này cũng vậy”. 3. A complete and independent sentence:
Punctuation and whitespace Full stop, comma, colon, semicolon, ellipsis, question mark, and exclamation mark are placed right after the preceding letter. A whitespace is needed before the next letter. Example: Hôm nay trời rất đẹp. Tôi muốn ra ngoài dạo chơi. Lúc chuẩn bị đi, tôi thầm nghĩ: “Có nên mang theo một chiếc áo mưa không nhỉ?” Vườn nhà tôi có rất nhiều loại hoa: hoa hồng, hoa mười giờ, hoa lan,... Xuân về hoa nở thật đẹp làm sao! There is no whitespace between the brackets or quotation marks (both opening and closing) and the text inside them. Whitespaces are placed between the brackets and the text outside them. Example: Ông B (giám đốc công ty) nói: “Tôi rất vui”. Comma before the word “and” (“và”) 1. If a response uses a comma before “và” when the sentence is listing objects => Localization issue. Example: Hoa đào, hoa lan, và hoa mai => Localization issue Hoa đào, hoa lan và hoa mai => No issue (*) Why Localization issue? The model is applying the rules in English while writing Vietnamese. 2. If a comma is placed before “và” to divide clauses, there should be no issues. Example: Mọi người cần phải chiến đấu chống lại những tai họa ấy: nông phu chiến đấu nơi đồng ruộng, bác sĩ chiến đấu nơi bệnh viện, và chiến binh chiến đấu ngoài sa trường. Date format In Vietnamese, we can interpret a date using the format: dd/mm/yy(yy) or dd-mm-yy(yy) (ngày trước, tháng sau). In most cases, 4-digit years should be provided unless only 2 spaces/underscores are given (usually seen when filling in digital forms). To present the date information in words, we write ngày... tháng... năm...