Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói

ictnews Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Hiện Zalo đang ứng dụng công nghệ xử lý tiếng nói vào phát triển và hoàn thiện trợ lý ảo Ki-Ki, đồng thời, sẽ triển khai tích hợp vào 2 sản phẩm Zing News và Báo Mới trong thời gian tới để mang đến trải nghiệm tốt nhất cho người dùng.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

Quy định dữ liệu người dùng Việt phải được lưu trữ trong nước đã có hiệu lực

Nghị định 53 quy định chi tiết một số điều của Luật An ninh mạng có hiệu lực thi hành từ hôm nay, ngày 1/10. Tại Nghị định này, Chính phủ đã quy định các loại dữ liệu Internet phải được lưu trữ tại Việt Nam.

Hội thảo trực tuyến ‘Doanh nghiệp đón đầu nguy cơ, chủ động ứng phó rủi ro tấn công mạng’

Để có những bước đi vững chắc trong quá trình chuyển đổi số, doanh nghiệp cần giữ vị thế chủ động, đi trước đón đầu những hành vi có thể xâm hại đến hệ thống để bảo vệ an toàn thông tin (ATTT), nâng cao năng lực cạnh tranh trên thị trường.

Apple chặn người dùng hạ cấp về iOS 16

Apple đã khóa sign iOS 16 và iOS 16.0.1, chặn người dùng hạ cấp từ iOS 16.0.2.

Cục An toàn thông tin: Hệ thống máy chủ mail một số đơn vị đã bị xâm nhập

Hệ thống máy chủ mail một số đơn vị đã bị xâm nhập từ khai thác lỗ hổng zero-day trong Microsoft Exchange, với các dấu hiệu nhận diện liên quan đến tấn công có chủ đích APT.

Vốn hóa Tencent ‘bốc hơi’ 623 tỷ USD

Tencent đã mất ngôi công ty đắt giá nhất Trung Quốc về tay Kweichow Moutai sau khi cổ phiếu giảm 64% giá trị kể từ đỉnh năm 2021.

Trung Quốc tố Mỹ tấn công mạng, Apple tuyên chiến mạng xã hội lớn nhất Nga

Trung Quốc tố Mỹ tấn công mạng; Apple tuyên chiến với mạng xã hội lớn nhất nước Nga;... là những thông tin nổi bật trong bản tin Công nghệ thứ 7 tuần này.

Chữ ký số Viettel-CA được tích hợp lên hệ thống e-GP

Từ ngày 29/9, dịch vụ chứng thực chữ ký số Viettel-CA đã tích hợp thành công lên hệ thống mạng đấu thầu quốc gia (e-GP), góp phần từng bước thúc đẩy tiến trình chuyển đổi số trong các tổ chức, doanh nghiệp.

Cơ hội nhận iPhone 13 khi đăng ký dịch vụ oneSME của VNPT

Hưởng ứng ngày Chuyển đổi số Quốc gia 10/10/2022, VNPT khởi động chương trình khuyến mại lớn nhất trong năm “oneSME - Đăng ký nhanh tay - Vận may sẽ tới” dành cho khách hàng đăng ký dịch vụ VT-CNTT trên nền tảng https://onesme.vn.

Vì sao Nhật Bản lao dốc trên bảng xếp hạng kỹ thuật số toàn cầu?

Nhật Bản tiếp tục xuống hạng xét về chỉ số cạnh tranh kỹ thuật số, cho thấy khó khăn của nước này trong việc hiện đại hóa hệ thống công và tư nhân.

AMD tung bộ xử lý Ryzen 7000 cao cấp, dành cho máy tính cấu hình 'khủng'

Hãng AMD giới thiệu ra thị trường Việt Nam bộ xử lý Ryzen 7000 dành cho máy tính để bàn, phục vụ chơi game, sáng tạo nội dung, đòi hỏi cấu hình mạnh.

Đang cập nhật dữ liệu !