Hệ thống dịch đa ngữ giữa tiếng Việt và một số ngôn ngữ khác

Đề tài “Phát triển Hệ thống dịch đa ngữ giữa tiếng Việt và một số ngôn ngữ khác” thuộc đề tài nghiên cứu ứng dụng và phát triển công nghệ cấp quốc gia (KC 4.0) được chủ trì bởi Trường Đại học Công Nghệ - ĐHQG Hà nội. Đề tài do TS. Nguyễn Văn Vinh (Trường Đại học Công Nghệ, Đại học Quốc Gia Hà Nội) làm chủ nhiệm. Tham gia đề tài là các chuyên gia hàng đầu trong lĩnh vực trí tuệ nhân tạo, và ngôn ngữ học từ các đơn vị Trường Đại học Công Nghệ- ĐHQGHN, Đại học Bách Khoa, Đại học Khoa học xã hội và Nhân văn - ĐHQGHN, VOV, Jaist, ….

Mục tiêu của đề tài là nghiên cứu làm chủ công nghệ dịch máy tiên tiến và xây dựng hệ thống dịch văn bản đa ngữ giữa tiếng Việt và các ngôn ngữ khác như tiếng Anh, tiếng Khmer, tiếng Lào, tiếng Trung Quốc. Ngoài ra, đề tài cũng nghiên cứu phương pháp thu thập kho ngữ liệu song ngữ cho các cặp ngôn ngữ, từ đó phát triển công cụ hỗ trợ trong việc xây dựng kho ngữ liệu song ngữ cho các cặp ngôn ngữ: Việt - Trung, Việt - Lào, Việt - Khmer.

Trải qua quá trình nghiên cứu, phát triển, và cải tiến hệ thống dịch đa ngữ đã cho kết quả khả quan giữa các cặp ngôn ngữ thông qua đánh giá bởi các phương pháp tự động và bởi các chuyên gia ngôn ngữ. Hiện nay, hệ thống dịch máy đa ngữ đã có sẵn và chạy thử nghiệm cho các cặp ngôn ngữ kể trên, người dùng có thể trải nghiệm hệ thống tại địa chỉ http://dichmay.itrithuc.vn/. Bên cạnh đó công cụ thu thập và xây dựng kho ngữ liệu song ngữ cũng đã được triển khai cho người dùng sử dụng tại địa chỉ http://songngu.itrithuc.vn/.

Hệ thống dịch đa ngữ trên cũng đã được triển khai sử dụng thử nghiệm tại một số đơn vị, trong đó website itrithuc.vn cũng đã được tích hợp chức năng dịch để người đọc có thể dễ dàng dịch các nội dung trên trang itrithuc sang các ngôn ngữ khác như tiếng Anh, tiếng Khmer, tiếng Lào, và tiếng Trung.