Công nghệ tiếng nói

Giới thiệu

Trong khuôn khổ Đề án “Phát triển Hệ tri thức Việt số hoá”, dự án nền tảng dữ liệu tiếng nói tiếng Việtbước đầu đã đạt được một số kết quả nhất định.

Dự án hiện đang có sự tham gia của Viện Công nghệ thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Trường Đại học Bách Khoa Hà Nội, Đài Truyền hình Việt Nam (VTV), Đài Tiếng nói Việt Nam (VOV), Công ty cổ phần Vbee (vbee.vn), Công ty cổ phần Vais (vais.vn).

Hầu hết dữ liệu tiếng nói của các hãng lớn đều không được chia sẻ với cộng đồng. Điều này không tạo ra điều kiện thuận lợi cho việc nghiên cứu, sáng tạo của các nhà khoa học cũng như việc ứng dụng các công nghệ hay kết quả nghiên cứu vào thực tế.
Mục tiêu của đề án là tạo ra một nền tảng thu thập, xây dựng và chia sẻ dữ liệu về tiếng nói tiếng Việt giúp phát triển các nghiên cứu và giải pháp về công nghệ tiếng nói như chuyển đổi văn bản thành tiếng nói và ngược lại, từ đó ứng dụng cho nhiều ngành và lĩnh vực khác nhau trong xã hội. Đây là một điều kiện cần và là điều kiện thuận lợi để các nhà khoa học có thể tiến hành những nghiên cứu chuyên sâu dựa trên lượng dữ liệu tiếng nói đủ lớn, tạo ra những lợi thế nhất định để có thể cạnh tranh trong khu vực và trên thế giới. Cùng với điều này, các doanh nghiệp có thể khai thác và ứng dụng các kết quả nghiên cứu vào giải quyết các bài toán thực tế tại Việt Nam, như trong việc tự động hoá đối thoại trong tổng đài thông minh, tương tác bằng tiếng nói trong trợ lý ảo hay các thiết bị IoT, hướng dẫn viên du lịch ảo, MC ảo, số hoá sách – báo – bài giảng điện tử…

Nền tảng thu thập, xây dựng và chia sẻ dữ liệu tiếng nói được phát triển dựa trên một dự án mở của Mozilla: Common Voice. Bất kỳ ai cũng có thể tham gia bằng cách thu âm giọng của mình trên web hoặc điện thoại để đóng góp vào kho dữ liệu dùng chung. Một người cũng có thể nghe và kiểm tra nhằm xác nhận chất lượng của những người khác để tạo ra những dữ liệu đáng tin cậy. Các đài truyền hình hoặc đài phát thanh như VTV và VOV có thể chia sẻ các audio, video về các bản tin, phim, các chương trình truyền hình… để làm giàu thêm kho dữ liệu cộng đồng. Các doanh nghiệp có thể chia sẻ dữ liệu và các ứng dụng sáng tạo cho cộng đồng sử dụng chính dữ liệu

Tác giả bài viết: http://speech.itrithuc.vn/