Các nhà nghiên cứu Microsoft trong nhóm phát triển công nghệ nhận diện giọng nói - Ảnh: Microsoft |
Theo thông báo từ tập đoàn này, các nhà nghiên cứu và kỹ sư thuộc bộ phận Trí tuệ nhân tạo và Nghiên cứu của Microsoft đã phát triển thành công một hệ thống nhận diện giọng nói với tỉ lệ mắc lỗi chỉ còn ở mức 5,9%.
Tỉ lệ lỗi 5,9% là tỉ lệ tương đương với tiêu chuẩn đặt ra với những người làm nghề sao chép nội dung từ âm thanh thành văn bản.
Nhà khoa học phụ trách lĩnh vực nghiên cứu công nghệ nhận diện giọng nói Xuedong Huang của Microsoft cho biết: "Chúng tôi đã đạt tới cấp độ tương đương với con người. Đây là một thành tựu mang tính lịch sử".
Với thành tựu này, lần đầu tiên một máy tính có khả năng nhận ra những từ ngữ trong một đoạn hội thoại giống như con người.
Thành tựu mới trong nghiên cứu của Microsoft đạt được sau nhiều thập kỷ nghiên cứu về công nghệ nhận diện giọng nói. Việc này khởi xướng vào đầu những năm 1970 với DARPA, cơ quan chuyên trách của Mỹ được giao nhiệm vụ nghiên cứu về những giải pháp công nghệ đột phá vì lợi ích an ninh quốc gia.
Qua nhiều thập kỷ, hầu hết các tập đoàn công nghệ lớn và nhiều tổ chức nghiên cứu lớn đã đổ công sức, tiền của vào lĩnh vực nghiên cứu này.
Dù vậy các nhà nghiên cứu cũng lưu ý, thành tựu đột phá mới trong công nghệ cho thấy khả năng nhận diện giọng nói của hệ thống đã có thể đạt trình độ "ngang ngửa" với con người, tuy nhiên điều đó không có nghĩa nó có thể nhận diện hoàn hảo mọi từ ngữ.
Trên thực tế, con người cũng không thể làm như vậy. Theo đó công nghệ mới cũng sẽ gặp khó giống như con người ở một số từ ngữ dễ bị nghe nhầm trong quá trình hội thoại.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận