Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói

ictnews Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Hiện Zalo đang ứng dụng công nghệ xử lý tiếng nói vào phát triển và hoàn thiện trợ lý ảo Ki-Ki, đồng thời, sẽ triển khai tích hợp vào 2 sản phẩm Zing News và Báo Mới trong thời gian tới để mang đến trải nghiệm tốt nhất cho người dùng.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

Khai mạc Diễn đàn Quốc gia phát triển doanh nghiệp công nghệ số Việt Nam Icon

Phó Thủ tướng Vũ Đức Đam cùng hơn 1.000 đại biểu các bộ, ngành, và chuyên gia, công ty công nghệ đang tham gia Diễn đàn Quốc gia về Phát triển doanh nghiệp công nghệ số Việt Nam (VFTE) sáng nay.

Apple có thể sớm đẩy sản xuất iPad sang Ấn Độ

Apple đang xem xét việc sản xuất một số iPad của mình ở Ấn Độ để giảm bớt sự phụ thuộc vào Trung Quốc.

Microsoft muốn làm siêu ứng dụng như WeChat

Theo The Information, Microsoft đang muốn phát triển siêu ứng dụng lấy cảm hứng từ WeChat nhằm phá vỡ thế độc tôn của Apple và Google.

Câu hỏi cân não trước giờ cho mở Internet vào Việt Nam

Nguyên Phó Thủ tướng Nguyễn Khánh nói rằng, Việt Nam có thể mở Internet sớm hơn, nhưng phải chuẩn bị cẩn thận cả về kỹ thuật, nhân lực, chính sách và quan trọng nhất là mặt tư tưởng.

Việt Nam thay đổi nhanh chóng sau 25 năm kết nối Internet

Quyết định mở cửa, kết nối Internet toàn cầu cách đây 25 năm là sự dũng cảm, thể hiện tầm nhìn xa, tích cực hội nhập, góp phần thay đổi toàn diện cuộc sống kinh tế, xã hội của Đảng, Nhà nước và lãnh đạo ngành TT&TT.

Apple sẽ mua chip sản xuất tại Mỹ

CEO Tim Cook xác nhận Apple sẽ mua chip sản xuất tại Mỹ của TSMC. Đây là bước tiến quan trọng đối với ngành sản xuất bán dẫn trong nước.

Doanh nghiệp ICT Việt Nam ngày càng tham gia sâu vào chuỗi giá trị toàn cầu

Cách đây 10-15 năm, các công ty phần mềm Việt Nam cơ bản chỉ thực hiện một số công đoạn theo đặt hàng của nước ngoài. Giờ đây, vị thế của doanh nghiệp ICT đã được cải thiện.

Vì sao Camera Việt Nam có lợi thế cạnh tranh với hàng nhập ngoại?

Các yếu tố bảo mật, thương chiến Mỹ - Trung, ưu tiên sử dụng hàng Make in Vietnam hay nguồn nhân lực chất lượng cao giúp camera Việt Nam cạnh tranh được với camera nhập ngoại.

Nhiều doanh nghiệp Việt lo ngại phần mềm tống tiền trong môi trường công nghệ vận hành

Theo khảo sát được Fortinet thực hiện cùng Frost & Sullivan, 92% doanh nghiệp tại Việt Nam chia sẻ mức độ lo ngại cao của họ về phần mềm tống tiền trong môi trường công nghệ vận hành (OT).

Nhiều công ty hào hứng với chủ trương phát triển doanh nghiệp công nghệ số Việt Nam

Chia sẻ tại họp báo diễn đàn Make in Việt Nam, nhiều doanh nghiệp cho biết chủ trương thúc đẩy sự phát triển của các doanh nghiệp công nghệ số Việt Nam rất có ý nghĩa với các công ty và startup khởi nghiệp.

Đang cập nhật dữ liệu !